知识图谱与AIGC的探索与见解!

  最近几年 AIGC 技术的发展十分迅猛,特别是近期以大规模预训练语言模型为基础的 ChatGPT 成功出圈,其展现出的强大的“通用智能”引爆了全网热议,也引发了人工智能领域的专家学者以及产业界的深刻思考。而知识图谱作为符号主义人工智能的典型代表,在这次浪潮中能够发挥什么作用?AIGC 的技术突破会给知识图谱的研究与应用带来哪些新的机遇?它们能够擦出什么样的火花呢?本次论坛我们有幸邀请到来自学术界和工业界的4位专家来分享他们的探索和见解,相信一定能为相关领域的广大从业人员带来启发。欢迎大家参与讨论!

  出品人:付瑞吉 快手 MMU 知识图谱中心负责人

  个人介绍:快手 MMU 知识图谱中心负责人,本硕博毕业于哈工大,中科大博士后,高级工程师。曾担任科大讯飞 AI 研究院副院长,获吴文俊人工智能科技进步奖一等奖。研究方向包括知识图谱、智慧教育等,在 ACL、EMNLP、Coling、IJCAI、TASLP 等国际会议和期刊上发表学术论文多篇,申请(获得)国家发明专利50余项。在科大讯飞期间,曾研发智能评阅技术,在多地中高考、CET 等大规模考试阅卷中应用;主持研发的个性化学习技术应用于讯飞学习机等多款教育产品中。2021 年加入快手,主持研发业界首个亿级别多模态短视频百科体系“快知”。

  冯骁骋 哈尔滨工业大学 副教授/博导

  个人介绍:冯骁骋,哈尔滨工业大学计算学部社会计算与信息检索研究中心副教授、博导。智能科学与技术系副主任。研究兴趣包括自然语言处理、文本生成、机器翻译等。在ACL、AAAI、IJCAI、TKDE、Chinese Science等CCF A/B类国际会议及期刊发表论文30余篇。据Google学术统计,论文引用数量超过2800次,一篇论文入选Paper Digest EMNLP 2020 Top Ten 高引论文。担任NIPS、ICML、AAAI、IJCAI、ACL等国际会议程序委员会高级/普通成员;中国中文信息学会自然语言生成与智能写作专委会副秘书长、中国计算机协会哈尔滨YOCSEF副主席等。与华为、腾讯、科大讯飞、微软等国际一流互联网公司保持长期科研合作关系。

  演讲题目:面向结构化数据的文本生成技术研究

  演讲提纲:近年来,随着深度学习方法的快速发展,文本生成技术也由科学研究走向了实际应用。目前,文本生成任务形式相对多样,包括:自动文摘、对话生成、风格迁移、结构化数据描述生成和多模态数据描述生成等,各个任务之间既存在一些任务驱动的特殊表示和规则也包含相对通用的技术路线和方法。本次讲解将在简要介绍文本生成任务的基础上重点围绕面向结构化数据的文本生成技术进行讲解,包括结构化数据的建模,知识的引入和不同知识的使用方式。期望本次报告对知识驱动的文本生成技术感兴趣的相关听众有所帮助。

  李丕绩 南京航空航天大学 教授

  个人介绍:李丕绩,南京航空航天大学计算机科学与技术学院/人工智能学院教授,博士生导师,2021年度南京航空航天大学"长空学者"获得者。香港中文大学博士,曾任腾讯AI Lab自然语言处理中心高级研究员。研究方向主要为自然语言处理,包括预训练模型、文本摘要、文本生成和对话系统。曾经在相关领域顶级会议如ACL、EMNLP、SIGIR等发表学术论文60余篇。多次受邀担任ACL、EMNLP、EACL、IJCAI等会议的领域主席。在工业界工作期间负责了多个语言理解、文本生成和智能对话相关重要项目的算法研发和产品发布,有丰富的科研落地实践经验。主持或参与多项国家自然科学基金、CCF-腾讯犀牛鸟基金、CCF-智谱大模型基金等项目。

  演讲题目:知识桥接的文本生成算法

  演讲提纲:虽然基于神经网络的对话系统已经取得了很大的进步,但是现有模型的成功仍然建立在基于大量训练数据的模式刻画和描述上面,在一些特定的应用场景中表现出知识表达运用和逻辑推理能力较弱的缺点,从而导致模型可解释性差、可控性低、容错能力弱等特点。调研发现,通过向神经网络中融入符号化的知识可以缓解上述这些问题,增强对话生成的质量。所以,我们探索了神经符号计算方式来进一步提升对话系统性能的可行性,具体包括开放文本到符号知识的抽取生成、符号语义表示学习和推理模型、符号推理约束的可控解码等策略。实验也表明所探究思路确实在对话系统和文本生成任务中能取得不错的结果。

  李直旭 复旦大学 研究员、博导

  个人介绍:李直旭,复旦大学计算机科学技术学院研究员、博士生导师,上海市数据科学重点实验室主任助理,复旦大学知识工场实验室执行副主任,曾兼任科大讯飞苏州研究院副院长,博士毕业于澳大利亚昆士兰大学,主要研究方向为认知智能与知识工程、多模态知识图谱、大数据分析与挖掘等。在领域主流期刊和国际会议上发表论文150余篇,主持十余项国家和省部级科研项目。

  演讲题目:AIGC 时代的多模态知识工程思考与展望

  演讲提纲:ChatGPT 的火爆出圈使得 AI 生成(AIGC)技术受到了全社会前所未有的广泛关注。此消彼长之下,传统的知识工程遭受了诸多质疑。在多模态智能领域,AIGC 的能力不断提升,多模态知识工程工作应该何去何从?是否仍有价值?在本次分享中,讲者将探讨当前 AIGC 技术耀眼“光芒”背后的“暗面”,思考与展望 AIGC 时代的多模态知识工程研究。

  听众收益:

  1. AIGC 时代的知识工程是否仍具价值?

  2. 多模态知识工程工作应何去何从?

  3. 多模态智能的实现路在何方?

  王文广 达观数据 副总裁

  个人介绍:王文广,达观数据副总裁,高级工程师,人工智能标准编制专家,自然语言处理和知识图谱著名专家,《知识图谱:认知智能理论与实战》作者,专注于AI 大工程、知识图谱、认知智能、自然语言处理、图像与语音分析、大数据和图分析等人工智能方向。现在是上海市人工智能标准化技术委员会委员,上海科委评审专家,中文信息学会(CIPS)语言与知识计算专委会委员,中国计算机学会(CCF)高级会员,中国人工智能学会(CAAI)深度学习专委会委员。曾获得多个国际国家级、省部级、地市级奖项,拥有数十项人工智能领域的国家发明专利和会议、期刊学术论文。在达观数据致力于将自然语言处理、知识图谱、计算机视觉和大数据技术产品化,以OCR、文档智能处理、知识图谱、RPA等产品服务于金融、智能制造、贸易、半导体、汽车工业、航空航天、新能源、双碳等领域。

  演讲题目:神经网络大模型 ⊕ 知识图谱 ⊕ 强化学习 = AGI(通用人工智能)

  演讲提纲:以人为本AGI :就是以人类为中心的通用人工智能,或者说人工智能是以服务人类为目的的,有名的“机器人三定律”说的也是这个。人工智能发展至今,已经出现了能够将神经网络大模型、知识图谱 、强化学习三者融合的系统(产品),而这已经隐隐散发出一点 AGI 的曙光,或者称之为婴儿期的 AGI。在这个节点往后,类似军备竞赛一样的投入研究和持续发展,曙光终究会成为朝阳,而婴儿也会茁壮成长!本次演讲围绕 神经网络大模型 ⊕ 知识图谱 ⊕ 强化学习 = AGI 方面的观点和思考,与大家一起交流。

  听众收益:

  1. ChatGPT、Google Bard 等AI 江湖的倚天屠龙记

  2. AGI 曙光初现

  3. AGI 范式探讨