开源开放知识图谱的构建与应用

  背景介绍

  人工智能正逐步从感知智能迈向认知智能,其终极目标是让机器具备类似人类的思维逻辑和认识能力,特别是理解、归纳和应用知识的能力,而知识图谱在这里面起到了非常关键的作用。在知识图谱技术研发和应用蓬勃发展的今天,许多优秀的开源开放项目涌现出,极大的提升了相关人员的研发效率。

  3月12日,9:00-12:45,在DataFunSummit2022:知识图谱在线峰会上,由阿里巴巴高级算法专家熊飞宇出品的开源开放知识图谱论坛,将从阿里巴巴,蚂蚁集团,字节跳动的从知识图谱构建与应用的全链路实践,再结合浙江大学与同济大学的开源开放知识图谱工具与数据的介绍,给广大从业人员带来一场知识图谱领域实践的全方位分享。

  参与论坛的观众不仅可以详细的了解到阿里电商图谱,蚂蚁金融图谱与字节内容图谱的构建与应用过程,也能够了解到这些构建与应用背后的相关开源数据与开源工具,为其今后从事相关研发提供了理论和工具数据层面的双重支持。

  开放促进互联,连接创造价值,工具和数据流通越开放,催生的应用场景越丰富,我们希望通过开源开放知识图谱论坛,与社会各界共同打造更多贴近产业核心需求的智能应用,促进整个行业的发展。

  具体日程

  详细介绍

  出品人:熊飞宇

  阿里巴巴 高级算法专家

  个人简介:熊飞宇,现任阿里巴巴集团业务中台数据智能负责人?。华中科技大学本科,美国Drexel University博士,期间带领科研团队与美国Janssen,Medtronic等多所知名公司进行了长期而深入的合作,在人工智能与生物信息领域取得多项成果。回国后加入阿里巴巴,负责业务中台包括商品、用户、交易、营销等核心能力的智能化建设,支撑着大量、多元的集团业务。带领团队通过和浙江大学,清华大学,中科院等多所单位合作,以商品等新零售业务为核心,完成基于多源、异构、多模态大数据构建千亿级别数字商业知识图谱的算法研究、系统研发和新零售应用,覆盖包括淘宝、天猫等业务单元超过7万亿零售成交额,获得钱伟长中文信息处理科学技术奖一等奖,杭州市省级领军人才,阿里巴巴优秀学术合作奖等奖项,并在人工智能顶级会议和期刊上发表多篇论文。

  分享嘉宾:

  1. 张宁豫 浙江大学?副教授

  演讲议题:开源开放的知识图谱工具和数据生态

  议题介绍:开放促进互联,连接创造价值,开放知识图谱是激活数据要素潜力的有力技术手段。数据的价值是在经济活动的信息交互过程中产生的——数据流通越开放,催生的应用场景越丰富;数据连接越充分,其价值也会得到不断放大和提升。在本次报告中,我将介绍知识图谱的开源生态,并详细解读现有的开源开放知识图谱构建工具和数据。

  内容靓点:

  靓点1:知识图谱领域的开源生态如何?

  靓点2:知识图谱领域有哪些开放工具?

  靓点3:知识图谱领域有哪些开放数据?

  个人简介:张宁豫,博士,浙江大学副教授。研究方向包括自然语言处理、知识图谱等,关注知识获取的低资源、多模态问题,在自然语言处理和知识图谱领域已发表近30余篇顶级会议和期刊文章,包括ICLR、ACL、EMNLP、NAACL、KDD、WWW、AAAI等;担任NeurIPS、ICLR、KDD、ACL等顶级会议程序委员会成员。

  2. 陈强?阿里巴巴 高级算法专家

  演讲议题:阿里数字商业知识图谱构建及开放

  议题介绍:面向阿里几十个业态迥异且复杂的业务单元,如何高效低成本的管理我们几十亿的商业要素数据(商品、商户等),如何从海量商品数据中挖掘出真正对业务有价值的洞察,真正实现全球一盘货,降低商家、小二的经营成本,提升消费者购物体验,都提出了巨大的挑战和难点。

  业务平台商品知识图谱团队迎难而上,重点攻关,联合清华大学、浙江大学、中科院自动化所、中科院软件所、苏州大学等五家学术机构,联合发布业务平台藏经阁知识引擎研究计划,创造性的通过和中台业务系统深度耦合,建立算法、平台、商家多角色协同运营机制,构建了一个具有千亿级规模的商品知识图谱,分享内容主要会介绍如何解决这种大规模、多源异构图谱构建过程中遇到的低资源、可解释性、灵活拓展的科研问题,涵盖知识建模、知识获取、知识融合、知识推理及知识服务,5大模块系统级支持单点科研创新与数据、应用之间热插拔,为业务带来可观的增量价值。

  今年我们又将过去几年藏经阁研究计划中的部分任务及数据集对社会公众开放,希望通过开放的方式,和科研界、产业界相关团队一起,推动知识图谱领域的发展,挖掘数据更大的价值,促进数字商务数字经济等领域的交叉学科研究,服务数字经济健康发展的国家战略需求。

  内容靓点:

  靓点1:藏经阁研究计划框架

  靓点2:阿里商品知识图谱构建及应用

  靓点3:商品知识图谱部分任务及数据集开放介绍

  个人简介:毕业于中国科学院计算技术研究所,目前整体负责阿里商品知识图谱建设,通过和阿里商品平台业务系统深度耦合,建立算法、平台、商家多角色协同运营机制,为业务带来增量价值。具有多年数据挖掘、知识图谱相关算法、工程经验,带领团队在ACL、AAAI等顶会上发表论文,并参与著作知识图谱相关书籍1本,帮助团队获得钱伟长中文信息处理科学技术一等奖

  3. 王昊奋 同济大学 特聘研究员、博士生导师

  演讲议题:OPENBASE:知识众包平台解析和新版发布

  议题简介:王昊奋,同济大学百人计划,特聘研究员,博士生导师。长期在一线人工智能公司担任CTO之职,拥有前沿科技视野及丰富的研发管理经验,荣获徐汇区学科带头人人才计划。他是全球最大的中文开放知识图谱联盟OpenKG发起人之一。他负责参与多项省部级AI相关项目,发表100余篇AI领域高水平论文,被引用次数达到2300余次,H-index达到23。他构建了全球首个可交互养成的虚拟偶像—“琥珀·虚颜”;所构建的智能客服机器人已累计服务用户超过10亿人次。目前,他担任中国计算机学会CCF术语工委副主任,SIGKG主席,CCF上海秘书长,中国中文信息学会CIPS理事语言与知识计算专委会副秘书长,上海市计算机学会自然语言处理专委会副主任,青工委副主任,上海交通大学AI校友会秘书长等社会职位。

  4. 贾强槐?蚂蚁集团?算法专家

  演讲议题:蚂蚁商家图谱的构建、融合应用及开放

  议题介绍:

  1.?概述蚂蚁商家图谱的全貌

  2.?分享蚂蚁商家图谱的构建方法

  3.?介绍蚂蚁商家图谱的跨融合应用

  4.?简述蚂蚁商家图谱的生态开放

  内容靓点:

  靓点1:可挂载算子的可视化知识生产链路

  靓点2:跨域知识融合能力模型

  靓点3:基于Encoder-Decoder框架的知识表示学习

  靓点4:基于蚂蚁业务的概念图谱开放

  个人简介:贾强槐,来自蚂蚁集团认知计算和知识图谱团队,中科大硕士。此前曾在网易、腾讯、神马搜索等实习/工作。研究兴趣包括自然语言处理、知识图谱、深度学习,及其在搜索推荐(实体推荐、query推荐)、通用问答、供给理解、营销等场景的应用,相关工作曾发表在CIKM、KDD等国际顶会。

  5. 张原 字节跳动 算法工程师

  演讲议题:电商内容多模态知识图谱技术

  议题介绍:兴趣电商背景下,电商生态从购物平台逐渐演化出前置的种草诉求。抖音拥有丰富多彩的内容生态,创作者生态和商品生态,在短视频种草的赛道上打下了坚实的基础。本次分享主要围绕如何利用多模态技术,构建底层的电商内容知识图谱。

  内容靓点:兴趣电商下的电商内容知识图谱做什么?

  个人简介:毕业于复旦大学,曾任职于阿里巴巴业务平台事业部,现任职于字节跳动电商知识图谱团队。

  活动报名