11月30日,由深度学习技术与应用国家工程研究中心主办、飞桨承办的WAVE SUMMIT+ 2022深度学习开发者峰会在线上举办。会上,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜带来文心大模型的最新发布。其中,百度联合深圳燃气、吉利、泰康保险、TCL、上海辞书出版社等不同行业头部企业一次性发布5个行业大模型,成为峰会一大亮点。
从技术研发到落地应用,大模型发展已经进入产业落地的关键期,与产业场景需求的高度契合是大模型真正助力产业发展的重要前提。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在峰会上指出了大模型的产业化路径:具有算法、算力和数据综合优势的企业,可以将复杂的模型生产过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。
目前,这条大模型产业化路径已在百度的产业实践中得到验证,联合行业头部企业研制行业大模型就是其中的重要实践之一。作为推进大模型在行业深度应用的关键举措,百度在今年5月率先推出行业大模型,以“行业知识增强”为核心特色,基于通用数据训练的文心大模型,加上挖掘行业应用场景中大量存在的行业特色数据与知识,再结合与行业专家一起研讨,引入行业实际业务积累的样本数据和特有知识,设计行业领域特色算法任务,提升大模型对行业应用的适配性。
本次峰会上,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜带来了文心行业大模型发布以来最集中的一次升级。百度联合深圳燃气、吉利、泰康保险、TCL、上海辞书出版社等多个不同领域行业头部企业重磅发布5个行业大模型:深燃-百度·文心、吉利-百度·文心、泰康-百度·文心、TCL-百度·文心和辞海-百度·文心,进一步印证了行业大模型的落地效果。
此次全新发布的行业大模型已经在各自行业的实际业务场景中得到了应用或论证。在燃气行业,“深燃-百度·文心”在环境巡检、安全监控等领域落地,有效解决了场景繁杂、识别困难等难题;在汽车行业,“吉利-百度·文心”应用于售后服务和汽⻋领域知识库构建等场景,实现了显著的效果提升;在保险行业,“泰康-百度·文心”应用于医疗单据识别等任务,平均字段识别错误率相对下降;在电子制造行业,“TCL-百度·文心”变革了传统质检算法流程,大幅提升了模型研发与运营效率,实现降本增效;在社科行业,“辞海-百度·文心”用于版权保护、词条管理和知识挖掘等方面,发挥了基础关键的技术作用。
截至2022年11月,文心已累计发布11个行业大模型,涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域,实现显著的效果提升,产业生态初步形成,正在成为加速推动行业智能化转型升级的重要力量。吴甜表示,文心行业大模型是百度与行业头部企业、机构联合探索出的行之有效的大模型产业落地方式,让大模型在实际应用场景中“不但能用还便捷好用”。
为了让企业和开发者更加方便、快速地使用大模型的最新能力,文心大模型的工具与平台进行了全面更新。吴甜介绍到,在工具方面,文心大模型开发套件全面升级,发布行业大模型定制工具,同时提供更加完备的场景化建模工具、更为丰富的模型精调工具,以及大模型可信学习工具,让大模型开发训练更加灵活高效;文心API服务支持多种模型尺寸的精调,体验专区提供更多可体验能力,同时基于大规模集群算力分布式推理加速能力,可满足大规模高性能产业级调用。
在大模型迅猛发展的当下,支撑大模型开发、训练和推理部署的飞桨深度学习平台也在持续进化。为了让大模型产业落地更高效便捷,飞桨提供了全流程产业化工具与平台,包括大模型开发套件、场景模型生产线等,极大降低应用门槛。
从WAVE SUMMIT+ 2022深度学习开发者峰会上的最新发布来看,文心行业大模型已经从先锋、探索性质,发展到了覆盖行业众多、体系完备的新阶段。未来,文心将与行业头部企业继续研发和优化行业大模型,探索大模型技术对实际场景中业务难题的创新解法,加速推动产业智能化升级。
审核编辑(王妍)