许多业务都需要涉及到标签体系的建设,尤其伴随着业务的扩大,标签体系需要趋向精细化,以支撑最终的精细化运营。那么,标签体系该如何建设并应用至业务场景中?本文作者结合案例做了梳理和解读,一起来看。 再放大来看,我们对世界的认知,也是基于先人给世界(宇宙)中的万事万物定了义、分了类、打了标签。
——而标签体系,顾名思义就是“形成体系的一个标签集合”,比如“知识体系”、“课程体系”,不是随便的一个集合就能称之为体系,这个集合(体系)要科学、合理,即遵循MECE原则,且要便于管理维护和迭代。 ——也就是建设标签体系,第一步是找到需要贴标签的业务对象;第二步在建立标签体系时,要满足科学合理(满足MECE原则)、可管理维护和可持续迭代,这几点要求。 掌握单点知识容易,设计一个知识体系,可就没那么容易了。 有自己知识体系、学习体系的人学习,其学习效率、学习质量,就是会比哪些零散化学习方式的人高。如果他俩PK,短期可能是后者胜,但长期来看,前者对后者一定是降维打击。 好了,闲篇扯的有点多。第一节带大家了解到了:
在后续章节中,我会以“【城市治理业务】中的标签体系建设”为命题任务,试图探讨如何设计【城市治理业务】场景下的标签体系,以及探讨该业务场景下的“标签体系”,可用于支撑哪些业务功能? 先设计标签体系,再建立产品?还是先建立产品,再从产品中收集标签需求? ——这个“鸡生蛋、蛋生鸡”的问题,我们先抛开。读到最后,读者必将自有体会。 二、城市治理业务中的标签体系建设在“城市治理”(智慧城市)领域,同样逃不脱标签体系的建设。在建设标签体系前,还是要先了解业务。下面带大家了解一下“城市治理”相关业务,感兴趣的可继续往下阅读(内容有点长,可分两次阅读)~ 1. 城市治理业务架构城市治理业务,狭义来说指的是【城市管理】,即由城管、交管等政府部门负责的各类违章事件的治理;广义来说,城市治理等于“一网通管、一网通办”,甚至再广点说,可以上升到国家安全层面的治理。 参与广义城市治理的政府部门有:国安体系、公安体系、大城管体系的各级部门,如公安厅/局/xx总队/xx大队/xx支队(经侦、刑侦、网安、治安、技侦等),城运中心/城管执法局(如上海市虹口区城运中心,主要负责虹口区的12345和一网通管业务),国安体系的情报局/技侦局/网络安全局等。 而城市治理的业务职责是:在法律权责约束下,解决城市运行过程中的一系列问题,包括基础设施的建设,人民和企业主体在日常生活工作过程中遇到的各类紧急及非紧急问题/事件,最终目标是运用各种先进的手段(管理手段、技术手段),不断提高人民群众的幸福感和满意度。 整个城市治理的业务架构,大致如下: 城市治理业务架构图(个人理解后绘制) 2. 城市治理业务的发展趋势、市场竞争格局1)城市治理的发展趋势 P:国家国务院等部门,倡导各级政府领导班子,执行“一网通管、一网通办”城市治理策略,各政府部门数据要协同、协作,打通解决数据孤岛问题,切实利用适用于本地区发展的技术手段和管理手段,解决各自的业务问题,提高人民群众的幸福指数,打造城市治理标杆案例,提高国际影响力,促进国际交流合作;也陆续出台了一系列政策。近期23年9月份出台的政策,则强调更多的是运用人工智能、云计算等技术,提高城市科学化、精细化、智能化治理水平;见:https://www.gov.cn/zhengce/zhengceku/202310/content_6907675.htm E:经济水平,我国一直处于世界第二大经济体,虽然当前社会大环境不太乐观,且国家内部有些地区还属于贫困地区,但总体经济水平较前几个十年已经改善了很多; S:人们的生活水平(包括精神水平、物质水平)在国家的繁荣发展下,得以不断改善提高,所以人民和企业越来越看重政府的公信力,期望办事能够少跑几趟,政府办事效率提高,解决问题能力提高,切实提升社会主体中人民群众的幸福感和归属感; T:大模型、AI、云计算、互联网+等技术不断发展,为各类业务场景提供了强有力的技术支撑。 因此,总体来看,到2027年,城市治理业务的发展趋势,都围绕着一个主基调:科学化、精细化、智能化。 2)城市治理业务的市场格局 早在上述政策出台前,也就是从2016年“互联网+”概念提出,再到后来的“AI+”战略提出,整个期间,一系列“互联网+”、“AI+”、“一网统管、一网通办”、“智慧城市”的产品和解决方案问世(市)。 那在这个领域【智慧城市】的玩家,有哪些典型代表?
——各家也是挑自家所长,做自己能做的解决方案/产品/服务/方案+产品+服务组合… ——而且各家的“解决方案/产品/服务/方案+产品+服务组合”也是逐步迭代、完善的一个过程。 总的来看,各厂商在【城市治理业务架构】中,分别做了哪些东西? 老东家百度智能云,已有了上述几款产品,其售卖的典型客户是成都市某客户。想了解更多,大家可自行搜索百度云、华为云、阿里云、腾讯云、电信云等公司官网,查看这些大厂给出的具体解决方案/产品。 4. 城市治理业务-标签体系实战思考一下,如果是你的话,你在如下真实的业务场景中,该如何建设“城市治理”业务下的标签体系? 给到你的输入有: 【城市事件智能识别系统】推送的“城管类”违规事件如“机动车乱停放”、“垃圾满溢”、“渣土车闯限行”、交管类”违规事件如“司机开车打手机”、“行人翻越护栏”; 【12345业务系统】推送的“投诉xx小区301户噪音扰民-家庭生活娱乐噪音扰民”; 【舆情系统】推送的“党风廉政类”舆情事件; 【110接处警】系统推送的“投诉xx小区301户噪声扰民-生活乐器扰民”工单; 【重点人管控系统】推送的xx人物预警数据; 【重点车辆监控系统】推送的xx车辆告警数据; 【网络情报侦察】平台推送的xx 社交账号涉政类违规情报线索; 【城市部件运行状态监测中心】推送的xx设备故障需要检修… 也就是说,【数据融合治理平台】的数据来源方有多个,每个来源的数据(人、账号、车、事件、风险、部件等)可能已经自带了多个维度的标签,也可能没有标签。 你要做的事情有两个:
舆情系统,要解决的是,及时发现网络上的风险舆情事件和风险话题,并进行预警推送,以及支持对任一话题、任一人物、任一组织、任一事件的网络行为监测及分析,支持业务定期撰写舆情分析报告; 1)舆情系统-标签体系实战 传统舆情系统,一般解决的是网上发酵的,且积累到一定热度的热点话题或热点事件的自动识别发现,并标记好业务分类,然后预警推送给相关业务方,以辅助业务方,基于推送的舆情分类标签及舆情详情,实现后续舆情工单的流转、处置;高阶一点的舆情系统(现在也成为基本要求),需要能够识别潜在的风险(现阶段还没爆发为热点,但存在引发社会舆论风险的可能);并支持对任一人物、任一组织、任一话题进行多维监测分析; 可以看到:舆情系统的分析对象仍是:人、地、事、物、组织。 下面给出我的设计思路(事件和人为例): ① 舆情事件标签体系构建 舆情事件涉及的范畴非常广,文化领域的娱乐明星的瓜,政法领域的领导班子的瓜,典型社会人物的一些行为,均有可能成为网络上的舆情热点。 为了使舆情事件(话题)分类科学,我采用如下分类纲领来进行设计参照,即政治、经济、文化、社会、生态五大一级分类,可保证标签完全穷尽。 在政治一级类目下,运用MECE原则,尽可能根据历史舆情案例情况,列举出政治领域的相关舆情风险。比如“国家安全”、“国际关系”、“执政形象”;在国家安全问题下,又包含:“意识形态”、“领土安全”、“恐怖活动”、“民族宗教”等典型问题,同时为满足MECE原则,每个标签下补以“其它”,使得标签完全穷尽。 其它一级分类向下拓展标签仍如此,需要对业务深刻理解(调研客户需求+调研竞品+搜集书籍相关资料),才能据此拆分出相互独立、又完全穷尽,又满足业务使用需要的标签体系。 ——一个辅助人工定义标签的好用方法是“关键词法”。 最终按上述方法,我构建了一套具有四个层级,共600+标签的舆情事件分类体系,这里列出部分: 在建好了这套标签体系后,为了使得标签可维护、可管理、可迭代,需要辅以【标签管理】工具/平台。系统AI算法和运营人员,均可以参照标签体系中对标签的定义(标签名称、标签数据样例、标签别名等)对业务对象打标。此外运营人员,还可以管理标签,修改标签别名、删除/编辑/添加标签语料等操作。 ② 人物多维标签体系构建 人物标签(画像)的构建思路:可以从“基本属性”、“行为习惯”两个维度来拆分;而关于人的基本属性标签和行为习惯标签,还均可以按事实标签(即真实情况)、机器预测标签来拆分。 人的姓名、性别、出生日期、车牌号、身份证号、社交账号、电话号等均可以看作是人的基本属性; 行为习惯,一般则由动态统计标签来构成,比如“最近3个月访问xx网站次数”这样来定义,也可以定义一个标签:“活跃”,其含义代表:最近x时间网络有发言且发言量大于n条(x,n支持配置)。 2)数据融合治理平台–系统功能及标签体系设计 “数据融合治理”平台作为“城市精细化运营管理”的支撑方,需要支撑其实现 “精细化、智能化、科学化”的城市治理目标。 在前面也提到了,【数据融合治理平台】的数据来源方有多个,每个来源的数据(人、账号、车、事件、风险、部件等)可能已经自带了多个维度的标签,也可能没有标签。作为数据融合治理平台的PM,该如何规划设计【数据融合治理平台】产品功能呢?以及数据融合治理平台的“标签体系”该如何构建呢? 以下是我抽象出的,关于【数据融合治理】平台核心功能的建设思路: ① 首先数据融合治理平台,需要对接不同数据来源不同数据规模、不同频次的数据,并入库存储;–因此需要具备【大数据】存储和管理功能,并提供入库接口或其它数据入库方式(如kafka中间件);在技术选型上,需要考虑支撑实时数据处理、离线数据处理等多种场景。 ② 由于各类数据可能是结构化的,可能是半结构化的,也可能是非结构化的(办公文档、文本、图片, HTML、各类报表、图像和音频/视频信息等),因此需要具备对半结构化和非结构化数据的处理能力; ③ 因为数据融合治理的实体对象包括:人、地、事、物、组织。因此需构建相应的人、地、事、物、组织数据库,以及它们之间的关联关系数据库,支持业务查询使用。并支持运营人员,对关系库中的关系进行管理,对实体库中的实体打标签。同时还需要支持运营人员,对打标用的标签库中的标签做增删改查。 所以还应配套一个【标签管理】工具,用于管理标签数据包括:标签名称、标签别名、标签含义、标签关键词词包、标签语料(图、文、视频、音频),以支撑算法使用该标签对数据打标。配套一个【关系管理】工具。 ④ 需要利用AI算法(文本相似度算法、图片相似度、跨模等技术)进行实体及实体属性的对齐,即不同的描述,但均指向同一对象;又比如不同社交账号,但其使用者均为同一人;再比如同一事件(涉事主体、事件摘要、事发地均为同一地点),但文本描述上有所不同,需要运用NLP语义识别能力,将其识别出来并做好归一,并给出相似度分数。 再比如同样一个标签,在业务场景A种叫做“噪音扰民”,在业务场景B中叫做“噪声扰民”,但本质是一个意思,这就需要在数据治理时,对标签名称进行规范化(规范化的一个好处就是:提高数据治理的效率;当然有些标签在不同业务场景中就是有自己独特的定义,这时便不需要做规范化处理,具体情况需要根据实际业务场景甄别)。 ⑤ 需要利用算法和策略,尽可能多维度地完善人、地、事、物、组织的画像标签。 ⑥ 需要利用知识图谱技术挖掘人、地、事、物、组织彼此之间的关联关系,这些关系可能包含显性关系(即张三与李四是“母女”关系;“张三”与“白白”近期在微博平台互动100次;),可能需要人工提前梳理出【实体-关系-实体】关系集合,以引导实现初版策略,而后算法可基于这个策略自迭代; ⑦ 数据融合治理成果(即打了多维度标签的人/地/事/物/组织),需要支持业务多条件查询,或主动push给业务,供业务查看。 城市治理业务-标签体系,应用场景? 可以应用在:
亦即电商、营销等领域的 【搜】、【推】场景。 全文总结本文回顾:
本文的内容,属实是有些长(冗余)呢,非常感谢你的耐心阅读。 写了整整两天。对我自己的复盘有所帮助,也期望对你有所帮助~ 以上,便是本文的全部内容了。本人关于【数据融合治理】、【大数据平台】的产品架构,以及核心功能,还有待调研攻破~ 可关注后续文章~ 本文由 @南方碟道 原创发布于人人都是产品经理。未经许可,禁止转载 题图来自Unsplash,基于CC0协议 该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。 |