曾用AI击败世界围棋冠军,今又推出AI开放平台,前交大教授为开发者打造“量体裁衣

  在国内AI创业圈里,薛贵荣是一位学术派创业者。2006年,其博士毕业于上海交通大学计算机专业,毕业论文获得中国计算机学会颁发的首批全国优秀博士论文奖。此后三年之间,他在上海交通大学计算机系担任副教授和特别研究员,主攻机器学习、信息检索、互联网营销等领域,后成为国内第一位在搜索领域顶级会议ACM SIGIR发表论文的科学家。目前,在机器学习领域的国际会议上,他已经发表论文70多篇。2016年,薛贵荣创立天壤智能科技公司,七年间带领团队先后在AI围棋、交通等领域取得突破。目前,该公司正在投身大模型的研发。

  

  图丨天壤创始人兼CEO薛贵荣(来源:资料图)

  自2022年底ChatGPT发布以来,生成式AI技术和大模型的不断突破,在全球范围内掀起一波又一波的热潮,这使人们不禁发出这样一个论断,即2023年可能会成为AI发展的重要转折点。马化腾更是表示,AI是几百年不遇的、类似发明电的工业革命一样的机遇。

  诚然,大模型为人类带来了诸多机遇。比如,大模型革新了人机交互的方式,我们能够通过自然语言进行输入。同时,基于大模型的能力,AI技术的使用门槛也大大降低。

  但是,目前的大模型也面临如下亟待解决的挑战。首先,大模型会产生令人真假难辨的“幻觉”,以至于一本正经地“胡说八道”。其次,政府或企业的核心数据具有私密性,无法直接输入到大模型中进行训练。同时,尽管市面上已经推出了上百个大模型,但仍然缺少可靠的中文大模型。并且,目前的大模型也存在封闭性,无法实时更新信息。

  基于此,天壤打造了一款名为“天壤小白开放平台”的AI场景应用开放平台,专门面向政企客户和开发者。7月7日,在2023年世界人工智能大会(WAIC)上,这款产品正式和大众见面。

  在WAIC的演讲中,薛贵荣表示:“我们致力于打造一站式的大模型应用开发体系,让AI成为像水电煤一样的基础设施。基于这些智能技术,我们不仅希望开发者能够开发属于自己的智能应用,还希望他们能够真正改造现有的软件和服务,让终端客户的体验变得更好。”

  “天壤小白”:让AI成为每个人的小助手

  为自家新品取名为“小白”,天壤有两方面的用意。首先,“小白”一词传递出的是一种亲切友好的感觉,也寓意AI技术的平民化,表达该公司希望该产品能够随时随地陪伴和帮助每个人,让其能够轻松使用并从中受益。其次,天壤也希望“小白”能够激发使用者的创造力,帮助他们自由地探索AI应用,并创造出更加令人惊叹的成果。

  “天壤小白”包含三款产品,分别是自研通用语言大模型、语义搜索引擎和应用开发平台。

  首先,通用语言大模型经过了1860亿参数的深度学习训练,具备多种核心能力,比如面向多语言的对话互动、知识问答和逻辑推理等,因此可以理解复杂度很高的上下文信息,并做出准确回应。从参数配置来看,该模型拥有1860亿参数的FP16大模型、1860亿参数的INT4大模型,以及7B小参数模型等不同成本的语言模型。用户可根据实际需求选择不同的模型方案,甚至是选择调用市场上其他的大语言模型或企业的私有模型。

  

  图丨“天壤小白”通用语言大模型的领先性能(来源:资料图)

  其次,如上所述大模型经常会产生“幻觉”,为了规避这方面的问题,天壤开发了精准的语义搜索引擎。该引擎能够增强大模型基于准确事实的生成能力,可在生成文本前后对相关的事实信息进行检索,对输入和输出进行验证,确保大模型生成的内容是正确完整的,避免大模型提供错误或者无意义的回答。

  具体来说,我们通常所面对的问题都存在边界,如果能将边界内的全部知识作为一个文档或框架,事先输入到大模型中,大模型在输出时就能基于该文档中的内容提供回答,不会存在胡编乱造的情况。

  此外,为了更好地推动大模型应用落地,天壤还提出了应用开发平台。该平台具有可视化的操作界面和灵活的应用配置,支持生成式、对话式和搜索式三种基于自然语言的交互方式。开发者可以根据不同的场景和需求,选择不同参数和精度的多元模型服务、配置提示词参数和交互类型,在十分钟内完成一个个性化的大模型应用的创建。即使是不具备编程基础的用户,也能快速开发出想要的AI应用。

  

  图丨“天壤小白”应用开发平台创建智能应用的五个步骤(来源:资料图)

  并且,该平台还支持外部文档和大模型对话功能。用户可以上传和管理大量的文档,并利用平台提供的语义检索和问答功能,快速搜索相关文档并获取所需信息。由于智能化的文档检索功能能够理解文档的上下文含义,所以其可以根据用户的提问给出准确答复。

  “总的来说,我们等于是打造了一个功能丰富的开发者平台,可以帮助开发者更加容易地开发AI应用。”薛贵荣表示。

  那么,“天壤小白”开放平台能够应用于哪些场景呢?

  从当下AI技术的发展趋势可以看出,未来AI将对各行各业产生深刻影响,每家企业都存在使用大模型提高生产和运营效率的需求。而小白开放平台内置丰富的AI应用市场和提示词的应用模板,并覆盖职场、办公、营销、外语、文档等多种场景,这有助于各行各业的开发者,创建基于自家企业私有数据的AI应用。

  比如,你可以创建一个AI法律助手,来帮助用户快速分析大量法律信息、理解复杂的法律文档和案例,并为用户提供准确的法律解读和指导,进而实现法律问题的高效解决;可以创建一个智能客服,由于事先在大模型中输入了企业的相关信息和私有数据,因此这种类型的应用能够快速地从大模型中定位、提取和汇总所需信息,为用户解决问题带来便利。

  另据悉,本次发布的小白开放平台为1.0版本,可满足大模型应用开发的基本需求,后续该平台会持续迭代,将朝着更注重实际应用的场景和需求出发。该公司计划上线Coding、SQL数据库等商业解决方案,以及与外部系统更好地交互集成的能力,以实现对行业的赋能,并助力更多实际问题的克服。

  在本次大会上,天壤宣布启动面向大模型生态的创业加速计划“蓝鲸计划”,为开发者提供全方位支持。未来会为开发者提供免费的办公场地和相关设备,提供大模型应用开发的专业技术支持,提供访问平台工具和调用大模型的能力,以及为优秀团队提供资金支持。

  天壤希望推动智能技术实现落地应用,让AI能够成为每一个人的助手。同时,其计划通过“蓝鲸计划“孵化1000个团队,助力其开发基于小白开放平台的AI创新应用。

  深耕通用人工智能领域,先后在AI围棋、交通、蛋白质等领域取得重要突破

  天壤在AI大模型领域的进展并不算慢,而这也得益于过去几年的积累。自成立以来,天壤一直在做通用人工智能方面的研究,目前已经具备深度学习、强化学习和数据生成等核心AI技术。同时,其也在上述领域做出了不少代表性工作。

  2018年,天壤推出自研的深度强化学习AI围棋TRGo,该产品仅用AlphaGo 1% 的计算资源,就击败了世界围棋冠军朴廷桓。2020年,推出城市级交通系统TRTraffic,帮助江西省南昌市从一个交通限行的城市,变为不限行的城市。2021年至2022年间,还推出了蛋白质折叠大模型TRFold和蛋白质设计平台TRDesign。

  此外,其也深刻认知到如今大模型面临的机遇和挑战,故能针对实际情况提供解决复杂问题的可行方法论。这些方方面面的原因,是天壤深入布局大模型领域的优势所在。

  大模型的诞生激发出了巨大的潜力和机遇,它不单单在聊天机器人层面实现了突破,更重要的是给整个信息产业和生态格局带来了革命性的改变。未来,所有的应用、平台和软件,都将基于大模型重新开发,各行各业也将迎来新一轮创新发展的局面。可以想象的是,“天壤小白”开放平台必将在这个过程中扮演 “赋能者”的角色。