0731-88575016

详细内容

竞技宝官网app·2022年中国知识图谱行业研究报告

时间发布时间:2024-07-24 08:56:47 来源:竞技宝app下载官网 作者:竞技宝官网地址     

  行业背景:感知到认知的跨越式发展,须引入发展认知技术,知识图谱在此形势下成为了破局的关键技术。数字经济的持续发展将加速知识图谱产业化进度,推动知识图谱与传统产业融合。高性能图计算可为图计算输送更快更准的计算能力,服务于知识图谱运算,算力规模化部署也为知识图谱计算的高密度、高功耗要求提供了有利发展条件。深度学习技术、NLP技术、知识图谱技术协同并进,尤其是NLP技术近几年的快速发展为知识图谱产业化提供了机会。

  行业规模:2021年,知识图谱核心市场规模预计达到107亿元,而到2026年,相应规模将超过296亿元,2021-2026年CAGR=22.5%。金融与公安两大行业的知识图谱占比较高且增长速度较快,其业务与知识图谱可密切结合,同时具备建设意愿与资金投入,因而成为了市场规模的主要拉力。未来,随着政务数字化建设的完善,政务对知识图谱的业务需求会逐渐唤醒,成为未来市场的拉力之一。

  建设重点探讨:知识图谱建设需面临的建设难点主要在于数据治理、行业专家储备、底层图数据库存储、算法生产流程与性能待提升、客户认知待培养以及产品封装形式待优化。攻克知识图谱的建设重难点将有利于从源头保证知识与智慧真实可靠、可用正确,储备培养深厚行业专家与技术复合型专家,升级底层图数据的存储方式,改善算法性能,为知识图谱建设减少阻碍。

  趋势展望:未来,知识图谱厂商、大数据厂商、NLP厂商、互联网大厂与信息化厂商等知识图谱业内参与者将从强化技术实力与深化行业认知的角度出发,结合自身原有业务优势,持续深化发展行业知识图谱业务。知识图谱业务场景也将不断迭代,行业应用场景边界拓宽,垂直应用场景被做深做透。知识图谱生态也将继续由监管引导方、供给方、需求方、投资方、高校及科研院所融合共建,汇聚建设合力,促进产业生态成长壮大。

  知识图谱是人工智能的一大底层技术,是描绘实体之间关系的语义网络,自带语义、逻辑含义和规则,通过三元组即“实体×关系×属性”集合的形式来描述事物之间的关系。知识图谱将非线性世界中的知识信息结构化、可视化,辅助人类进行推理、预判、归类。知识图谱中的图并非图像概念,而是类似化学分子式的结构,一个知识图谱往往存在多种类型的实体与关系。知识结构网络化、网络结构复杂、网络由三元组构成、数据主要由知识库承载是知识图谱的四大基本特征。一般而言,知识图谱的数据以文本化数据为主,数据化数据为辅。

  一般而言,知识图谱需执行的主要任务包括知识图谱构建与补全、实体统一(消歧)、实体分类、知识检索问答(简单推理)、复杂关系推理。现阶段的复杂关系推理需要更多依赖人类预测与推断各种可能的情况,并优先推荐可能性大的情况。

  知识图谱的产品类型以通用知识图谱与行业知识图谱为典型代表。通用知识图谱经过开拓性构建阶段后,逐渐演变为通用互联网知识图谱,形成搜索引擎、智能推荐、智能问答三大产品类型,产品发展较为成熟。行业知识图谱处于起步期,但其价值及效果逐渐被客户所认可,是知识图谱当前乃至未来一段时期内的发展热点。

  知识图谱的产品形态颇有“盲人摸象”之意。各类厂商分别通过自然语言处理、知识库、数据库、数据平台或中台、机器学习等产品逐步接触到知识图谱,在已有的业务基础上叠加知识图谱产品,或开发出独立的知识图谱产品业务线。就当前的五大产品形态而言,其中的任意一种都可算作知识图谱产品,且知识图谱产品一般为五类产品形态的排列组合复合体。

  在各类知识图谱的产品形态中,大数据知识图谱的数据产品属性强于知识图谱属性。在数据中台、大数据平台以及其他数据解决方案中,可频繁观察到知识图谱这一画龙点睛的模块或组件,多数大数据厂商也常常自诩自己具备知识图谱能力。然而,一旦深究其中的知识图谱行业能力、底层技术能力,多数厂商的知识图谱工具往往难以覆盖知识图谱本该具备的完整生产流程,并且缺失核心的Schema建模技术,现阶段知识图谱在大数据产品中的地位及作用就显得十分有限。

  知识图谱产品在当下及未来的行业发展热点主要围绕大数据知识图谱、行业知识图谱两大类产品展开。大数据知识图谱侧,行业参与者主要分化为两大阵营,一类选择做简单的知识图谱可视化展示,不深究场景类产品的开发,另一类则在数据积累的基础上,效仿行业知识图谱厂商做场景的深度挖掘与沉淀,以期实现数据治理能力与场景产品化能力的双融合。行业知识图谱侧,知识图谱作为“行业专家”这一概念的火热潮逐渐退却,参与者在看到B端广大市场空间的同时,也深刻意识到搭建高业务价值、强专业性知识图谱的不易,因而招纳更多的业务端人才,弥补业务短板,促成技术与业务的双融合。

  随着信息化与数字化建设的展开与NLP技术的进步,知识图谱不再局限于网络百科式的搜索,其衍生出了互联网内容与社交、大数据知识图谱与行业知识图谱等多种产品类型,产品专业化与场景化的趋势日渐明显,行业知识图谱已经成为市场开拓重点。金融与公安两大行业的知识图谱占比较高且增长速度较快,其业务与知识图谱可密切结合,具备建设意愿与资金投入,因而成为了市场规模的主要拉力。据艾瑞统计测算,在2021年的行业市场结构中,金融与公安的市场份额合计共占总市场的38.2%。未来,随着政务数字化建设的完善,政务对知识图谱的业务需求会逐渐唤醒,成为未来市场的拉力之一。从市场整体来看,2021年中国知识图谱核心市场规模为107亿元,到2026年,核心市场规模可突破290亿元,2021-2026年CAGR=22.5%。

  各行业赛道知识图谱产业情况可从技术、业务、执行三大维度进行评价和对比。互联网是知识图谱产业最成熟的赛道,一般提供轻量级的应用服务,开发难度较低。相比之下,其他行业的知识图谱产业仍处于建设期,且以金融的表现为标杆。政务、工业都有巨大的数据量,但业务专家储备密集度、业务场景明确程度、客户配合度的评价偏低,需要较为漫长的磨合过程。尽管医疗领域的专家储备与业务场景明确度表现较好,但因各级医院资源利益不统一,文本数据理解难度大,其产业发展远不如人们所希冀的高专家水准。

  互联网的海量信息带有碎片化与非架构化特征。新兴互联网应用的蓬勃发展,让完整信息被分类分解为信息片段,信息被大量简化,从而导致信息本身不全面、内在逻辑不完整。同时,文本、图片、各类报表和音频、视频、HTML等非结构化数据广泛存在于互联网中。互联网企业需要在现有的存量业务中,收集碎片化信息,处理非结构化数据,挖掘信息间的潜在联系,还原完整的、有价值的信息。然而,信息的关联关系挖掘是一项工作量巨大且复杂的工程。

  互联网产品的生命周期路径规划需求:任何的互联网产品都会经历探索期、成长期、成熟期、衰退期四大阶段,每一阶段各有其痛点。探索期的产品在设计规范与方向上缺乏可参考的产品,难以找到产品的设计方向;成长期的产品往往同质化严重,难以找到产品的创新点,并在竞品竞争中取胜;成熟期的产品基本定型,需要在产品细节上做设计与把控。针对每一阶段的痛点,都需要做好路径规划,持续进行产品迭代,解决产品所处阶段的核心问题。产品迭代设计规划需要依赖合理可靠的决策依据,而决策依据源自将已经结构化的商品表现数据、行业信息等构建成网络,发现数据之间的潜在关联。

  以存量产品迭代为例进行解释:某APP起初以本地生活服务为主打功能,但该APP已经较为成熟,同时期还存在一些竞争对手。产品设计师考虑在现有功能上叠加旅游服务与电商服务,以增加产品的差异化程度。

  商品方面:市场管理差异导致的商品信息差,线上商品存在多种表达方式,标准化程度不足;线上商品缺乏个性化设计与表达,对用户引导不到位,难以激发用户兴趣,不利于用户做出消费决策。

  用户方面:网页端与移动端都会留下用户的行为数据痕迹,用户的消费观念隐藏在这些数据以及数据间的关联关系中。若要为用户精准推荐个性化内容,将用户切实转化为消费者,需要对用户的数据进行挖掘,刻画用户画像。

  核心原理:通过网络信息与数据搭建通用知识库,将具有相关性的信息联系起来,将完整丰富的信息推荐给用户。

  核心价值点:盘活长尾冷门的实体,实现碎片化信息聚合,还原完整信息,补充用户未知知识(尤其是时效性与新奇知识),激发用户搜索兴趣。

  示例:某公司已有的存量业务为电商零售,基于信息后台的知识图谱网络反馈,业务的用户活跃度基本稳定,旧业务已进入成熟期,公司可以寻找存量业务的突破口。图谱提示决策人员公司已经具有物流配送、生鲜供货商、C端用户的资源优势,可考虑开拓生鲜市场。

  核心原理:基于用户信息库与商品信息库,构建商品决策知识图谱,在导购的具体场景中推送符合用户偏好的商品。

  核心价值点:对于用户而言,快速触达所需的商品种类,提高决策效率;对于商户而言,辅助商品导购,实现商品的个性化推荐与精准营销,增加商品收益。

  核心原理:将用户的消费记录、家乡、历史口味偏好等信息构建成知识图谱网络,计算出不同维度下的推荐分值,分值最高的路径即为推送结果。

  核心价值点:对于用户而言,能够为用户提供个性化、度的内容推荐,激起用户兴趣,减少对商户评价内容的依赖,缩短用户的筛选时间 ;对于商户而言,能够帮助商户吸引客流,增加业务收入。

  信贷,是一种仅以个人信用作为放贷依据的金融业务,具备风险性。传统信贷面临人力依赖性强、数据碎片化、对借款人信息分析不到位等业务痛点,解决方案正是数字化建设。随着金融与科技的融合发展,金融市场正在加速开放,信贷需求也在不断延展,整个金融信贷产业正逐步向无接触信贷转变。基于无接触信贷所展现出的大流量、信息不对称、高可触达特点,信贷业务痛点在原有痛点基础上有所增加:下沉客户质量泥沙俱下,加大了金融业的信贷风险;团伙作案犯罪手段日渐专业化、隐蔽化,欺诈风险提升。引入知识图谱可提升金融风控防范手段,针对痛点2、痛点4、痛点5“对症下药”。

  贷前、贷中、贷后的工作更依赖风控人员经验,需雇佣较多员工,人力成本高;审批方式以人工审批为主,一般需要2-3周以上方能放款,审批时间长、效率低下、手续与流程繁琐。

  在对公业务中,部分项目信息数据呈海量碎片化,尽调成本高、考证难度大,这一问题对于创新型小微企业更为严重,效果有限的风险识别监测手段不利于评估企业客户及其风险事件。

  评估企业信用情况时,银行更多依赖企业历史财务信息进行静态分析,依据较为单一的评价作出信贷决策,难以完全把握借款人真实的经营状况,存在评估局限。

  伴随着无接触信贷兴起,线上金融业务日益增多,助推金融服务下沉,客户流量入口多元化,随之而来的是金融客户下沉。部分客户是通过第三方平台推荐引入的流量,这些客户的信用能力层次不齐,信用风险加剧。

  保险、和信用卡申请是一些极容易出现信贷欺诈的领域。信贷团伙为实现骗贷,会有组织、有谋划地开展欺诈,其经手的单笔欺诈金额在几千至上万之间。基于信贷团伙犯罪活动呈现出组织化、专业化、隐蔽化的特点,违反犯罪分子具有相关金融行业的从业经历,犯罪手法相较于过去有了较大程度的提高,而金融一线基层人员对信贷团伙作案的识别与防范存在短板,这为金融业的正常稳定运行埋下了巨大隐患。

  第一章已提到,知识图谱是复杂的关系语义网络,可以从关系角度提供分析问题的能力,这有利于从正常的特征与行为中挖掘出异常的信用风险与团伙欺诈行为,提升金融机构的风控能力。

  对私业务:个人身份、社交关系网络、消费记录、资产负债、年龄等信息可较为客观反映出的实际消费能力。

  对公业务:企业间关系,以及司法税务、信贷结算、财务和舆情等业务均可被记录与汇总,这些已记录的信息可透露出借款逾期、负面影响、财务资金漏洞等风险,而风险间具有传导关系,概率大小不。


竞技宝官网app
电话:13973131243
邮箱:dingdangang@douyin.com
地址:竞技宝官网app
扫一扫浏览手机站