正在读取数据,页面载入中,请稍后...

文心大模型

随着数据井喷、算法进步和算力突破,效果好、泛化能力强、通用性强的预训练大模型(以下简称“大模型”),成为人工智能发展的关键方向与人工智能产业应用的基础底座。

百度文心大模型源于产业、服务于产业,是产业级知识增强大模型。百度通过大模型与国产深度学习框架融合发展,打造了自主创新的AI底座,大幅降低了AI开发和应用的门槛,满足真实场景中的应用需求,真正发挥大模型驱动AI规模化应用的产业价值。

文心大模型的一大特色是“知识增强”,即引入知识图谱,将数据与知识融合,提升了学习效率及可解释性。文心ERNIE自2019年诞生至今,在语言理解、文本生成、跨模态语义理解等领域取得多项技术突破,在公开权威语义评测中斩获了十余项世界冠军。2020年,文心ERNIE荣获世界人工智能大会WAIC最高奖项SAIL奖。

2022年11月30日,由深度学习技术与应用国家工程研究中心主办、百度飞桨承办的WAVE SUMMIT+2022深度学习开发者峰会举行。

百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜发布文心大模型的最新升级,包括新增11个大模型,大模型总量增至36个,构建起业界规模最大的产业大模型体系,并通过大模型工具与平台的升级和文心一格、文心百中等基于大模型技术的产品应用,进一步降低大模型产业化门槛,让更多企业和开发者步入AI应用的新阶段。

2023年6月,百度文心大模型3.5版本已内测可用。

文心全景

文心大模型持续围绕“产业级”、“知识增强”两大特性,延续“降低应用门槛”的发展路线,进行创新突破。

在模型层,文心大模型涵盖基础大模型、任务大模型、行业大模型的三级体系,全面满足产业应用需求;

在工具与平台层,全面升级大模型开发套件、文心API和提供全流程开箱即用大模型能力的EasyDL和BML开发平台,全方位降低应用门槛;

新增产品与社区层,包括AI艺术与辅助创作平台“文心一格”、产业级搜索系统“文心百中”和旸谷社区,让更多人零距离感受到最先进的AI大模型技术带来的新体验。

特色优势

1、知识增强:从大规模知识和海量数据中融合学习,提升了学习效率、可解释性及模型效果

2、产业级:源于产业实践,服务于产业实践,满足真实场景中的应用需求

模型优势

1、模型效果优:所需标注数据少,在各场景上的效果处于业界领先水平

2、生成能力强:拥有丰富的AI内容生成(AIGC)能力

3、应用门槛低:文心大模型提供了丰富的平台与工具,包括大模型开发套件、API以及内置文心大模型能力的EasyDL和BML开发平台

文心 · 行业大模型

文心大模型与各行业企业联手,在通用大模型的基础上学习行业特色数据与知识,建设行业AI基础设施。

截至2022年11月,文心已累计发布11个行业大模型,涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域,实现显著效果提升,产业生态初步形成,正在成为加速推动行业智能化转型升级的重要力量。

文心行业大模型是百度与行业头部企业、机构联合探索出的行之有效的大模型产业落地方式,让大模型在实际应用场景中“不但能用还便捷好用”。

航天-百度 · 文心大模型

航天-百度·文心由百度和中国探月与航天工程联合研发。百度CTO王海峰介绍,作为世界上首个航天领域大模型,航天-百度·文心可以将航天领域的数据和知识融合学习,对航天数据进行智能的采集、分析和理解,助力深空智能感知、规划和控制等技术突破。

国网-百度 · 文心大模型

国网-百度 · 文心由百度和国家电网联合研发。在能源电力行业,百度与国家电网合作,共同探索了行业大模型机制。基于通用文心大模型,百度与国网的专家们一起,引入电力业务积累的样本数据和特有知识,并且在训练中,结合双方在预训练算法和电力领域业务与算法的经验,设计电力领域实体判别、电力领域文档判别等算法作为预训练任务,让文心模型深入学习到了电力专业知识,在国网场景任务应用效果提升。

浦发-百度 · 文心大模型

浦发-百度 · 文心由百度和浦发银行联合研发。文心大模型结合浦发场景积累的行业数据与知识,双方技术和业务专家一起设计了针对性的财报领域判别、金融客服问答匹配等预训练任务,让文心大模型学习到金融行业的知识,在浦发典型任务应用效果显著提升。

人民网-百度·文心大模型

针对新闻行业内容繁杂、信息提取难度极大等痛点,人民网与百度在传媒行业场景、大数据和AI算法上合作,引入人民网舆情数据中心积淀的行业知识, 顺应内容与技术发展,联合研发知识增强的传媒行业大模型,打造全媒体时代内容科技创新引擎,加速传媒行业的智能化升级。

人民网-百度·文心能够大幅度提升传媒行业自然语言处理任务的效果,并在诸多媒体行业的下游任务中得到了验证。例如,新闻摘要生成任务上,人工测评可用率提升约7%;新闻内容审核分类、舆情分析等任务上,相对通用大模型,媒体行业大模型取得了4-6%的效果提升。

该行业大模型已经在新闻内容分类、新闻情感分析、新闻摘要生成等多个媒体场景得到应用。

冰城-百度·文心大模型

面对城市建设、管理、服务内容繁杂、事项广泛,人力消耗巨大等挑战,冰城哈尔滨与百度结合城市发展需求、人工智能算力、算法、数据,联合研发了加速数字政府建设、支撑高质量数字化发展的智慧城市大模型冰城-百度·文心,赋能城市精准治理,致力于打造辐射全国的城市智能化标杆。

目前,冰城-百度·文心大模型已在哈尔滨智慧城市的具体应用场景,如市长热线工单分类、投诉工单信息抽取等场景中得到验证,取得了显著的效果提升。在政府管理更加场景化、服务更加个性化的数字政府背景下,文心大模型的引入正在支持哈尔滨城市治理、产业发展、公共服务等多领域实现智能化转型。

电影频道-百度·文心大模型

电影频道-百度·文心由电影频道与百度联合研发,通过结合双方在视频修复数据、AI技术与大算力上的优势,全方位提升视频修复效率和观感体验效果,以AI技术加速超高清视频产业的智能化发展进程。

测试数据显示,使用电影频道-百度·文心大模型每天可修复视频28.5万帧,解决了绝大部分视频画面的修复问题。即便是需要进一步精修,修复速度也能提升3-4倍。

深燃-百度·文心大模型

针对燃气行业中槽车作业、园区生产等场景存在安全隐患的痛点,深圳燃气与百度进行深度合作,在行业数据、AI算法和算力上优势互补,联合建设燃气行业大模型,确保工作人员进行安全作业、消除安全隐患,助力燃气行业智能化升级。

使用深燃-百度·文心大模型,在燃气行业场景的工业巡检、环境巡检两个子场景下,准确率平均提升2.5% 、召回率平均提升4.5%,所需标注数据相比传统模型下降90%,泛化能力大幅提升, 同时能够减少算力消耗和训练时间。

TCL-百度·文心大模型

面对电子制造行业产线繁多、质检工艺复杂且精度要求高的痛点,TCL和百度在行业数据、AI算法及大算力上实现优势互补,共同构建TCL-百度·文心电子制造行业大模型,不仅变革了传统质检算法流程,同时大幅提升了模型研发与运营效率,实现了成本的降低和业务效率的提升。

使用TCL-百度·文心大模型,在TCL两个产线检测mAP指标平均提升10%以上;训练样本减少到原有训练样本的30%~40%,产线指标即可达到原有效果,新产线冷启动效率可提升3倍,产线上线开发周期降低30%。

泰康-百度·文心大模型

结合泰康与百度在保险行业的特有知识、AI算法和大算力上的经验优势,双方联合建设了面向保险行业的大模型泰康-百度·文心,在医疗保险理赔中提供信息的自动化识别和提取,助力保险产业智能化升级。

该模型在4类医疗票据上的平均字段识别率可达到90%以上,在多行字段、印章遮挡等复杂场景下,OCR结构化信息抽取表现依旧强劲。基于泰康-百度·文心大模型,能够加强健康险理赔各环节自动化能力建设,实现理赔支付全流程时效提升。

吉利-百度·文心大模型

立足于汽车行业知识庞杂、客服人力需求大等业务痛点,吉利与百度融合了双方在通用人工智能科研与汽车领域AI应用的优势,联合研发了聚焦于汽车行业的大模型, 共同推进汽车产业通用智能化,在降低AI应用落地成本的同时,进一步提升汽车行业AI应用的效果与价值。

共建模型的智能客服知识库扩充任务人工评估可利用率相对基线提升24.37%,能大幅提高问答的泛化水平,提高客服系统的智能化体验; 除此以外,在车载语音系统短答案生成、汽车领域知识库构建等生成任务上的效果均有20%-35%的提升,可辐射至多个汽车行业场景。

该模型已经在包括智能客服系统、车载语音系统、领域知识库构建等汽车行业场景得到应用。

辞海-百度·文心大模型

针对人文社科知识庞杂、数据海量、知识提炼精度高效率低等行业痛点,上海辞书出版社与百度携手,将预训练大模型与《辞海》建设相融,吸纳无数人文社科专家学者们的智慧结晶,推出面向人文社科领域的大模型, 有望在人文社科领域发挥通用人工智能的价值,加速传统行业数字化、信息化、智能化建设。

该模型在知识挖掘-词条发现任务的F1值提升3.4%,有效地提升了信息抽取的效率,助力领域知识图谱构建;

除此以外,该模型在词条管理-同名条目去重、版权保护-侵权检测等理解任务上的效果均取得显著提升, 可广泛应用于多个人文社科行业的场景。

文心一言

2023年2月7日,经百度确认,类似ChatGPT的项目名字确定为文心一言,英文名ERNIE Bot,三月份完成内测,面向公众开放。

文心一格

飞桨文心一格是百度推出的AI艺术和创意辅助平台,让用户实现一语成画,只需输入一段创想文字,即刻生成创意精美的画作。

它既能启发画师、设计师、艺术家等专业视觉内容创作者的灵感,辅助其进行艺术创作,还能为媒体、作者等文字内容创作者提供高质量、高效率的配图,更是为大众用户提供了一个零门槛绘画创作平台,让每个人都能展现个性化格调,享受艺术创作的乐趣。

文心百中

文心百中是百度搜索与文心大模型联合研制的产业级搜索系统。以极简的策略和系统方案,替代传统搜索引擎复杂的特征及系统逻辑,可低成本接入各类企业和开发者应用,并凭借数据驱动的优化模式可实现极致的行业优化效率及应用效果.

文心百中具备三大特性:

极简:文心百中采用纯神经搜索架构加数据驱动搜索效果优化策略设计而成,仅需三步即可在线完成搜索引擎的构建;

强大:文心百中拥有强大的语义理解能力,相比传统模型实现了质的提升,已在多个场景展现惊艳的搜索效果;

高效:文心百中具备搜索系统从0到1的高效建设能力,相比传统搜索系统可减少人力成本90%以上;

同时,基于小样本学习能力极强的文心大模型,文心百中仅需少量的数据,即可实现不同行业的搜索效果优化,十分高效。

文心大模型API

文心大模型API服务平台是基于产业级知识增强文心大模型打造的便捷高效的新一代开放平台。

为用户提供多样化的大模型API服务,用户可在体验专区零代码调用大模型能力,自由探索大模型技术如何满足自身需求;

也可以通过API调用方式进行大规模商业调用,将大模型能力集成于自身业务中。

零门槛开发平台 飞桨EasyDL

文心通过百度EasyDL平台提供零门槛NLP开发服务,该产品适用于NLP零基础或追求高效率开发的企业用户和个人开发者,无须了解算法细节,三步即可快速定制NLP模型。

平台支持文本分类-单标签、文本分类-多标签、短文本相似度、情感倾向分析、文本实体抽取、文本实体关系抽取等任务;

支持文本智能标注,最高可节省90%的标注成本;模型支持公有云API调用、本地私有化部署,最快5分钟即可集成,性能优异。

全功能开发平台 飞桨BML

文心通过百度BML平台提供全功能NLP开发服务,该产品适用于NLP专业开发工程师,也可满足NLP初学者的使用诉求,产品预置领先的NLP算法,可为开发者提供少代码模型训练和便捷组网调参的开发体验。

平台支持文本分类、短文本匹配、序列标注、实体抽取等NLP经典任务类型;预置多种算法网络,如BOW、CNN、GRU、TextCNN、LSTM、BiLSTM等。支持公有云一键部署与调用、离线私有化部署,满足不同开发者需求。

旸谷社区

大模型创意和探索社区旸谷,汇集开发者们研发设计的50余个基于大模型的精彩应用,让更多人零距离体验AI大模型技术,激发创新与创意。

荣誉表彰

2020年5月,基于知识增强的持续学习语义理解技术ERNIE荣获《2020年度中国人工智能学会优秀科技成果》。

2020年7月,发布ERNIE-ViL,首次将场景图知识融入多模态预训练,刷新了5项多模态任务纪录,并登顶权威榜单VCR。

2020年7月,文心(ERNIE)语义理解技术与平台正式发布,并荣获2020世界人工智能大会最高荣誉SAIL奖(Super AI Leader,卓越人工智能引领者)。

完结撒花

免责声明

全民百科词条内容由用户共同创建和维护,不代表全民百科立场。如果您需要医学、法律、投资理财等专业领域的建议,我们强烈建议您独自对内容的可信性进行评估,并咨询相关专业人士。