“通义听悟”是阿里云推出的基于大模型的工作学习AI助手,于2023年6月1日开始正式公测。
发布背景
通义听悟是通义家族第一个面向大众消费者端的应用产品。
在多媒体时代,人们每天记录、分享和观看大量的音频视频内容,通义听悟通过前沿的语音AI技术,能够准确地将音频视频内容转写为易读的文字。不仅如此,结合通义千问大语言模型的强大理解能力,通过全文摘要、章节速览、发言总结等功能,使用户能够从不同角度“一目十行”地更高效“阅读”音视频内容。
随着大模型能力的飞速进步,通义听悟能为用户提供更多先进的能力,帮助用户梳理和挖掘出音视频内容中的信息价值,并将所有的记录和收集都沉淀为知识资产,随时供用户回顾和利用。借助通义听悟,用户可以如实地记录一堂精彩的讲座、一次深度访谈或一场重要会议,它将成为用户身边的智能伙伴,“听”遍所有内容,“悟”得其中深意。
发展历史
2023年6月1日,2023阿里云峰会·粤港澳大湾区于广州举行,阿里云智能首席技术官周靖人宣布推出通义家族最新产品——工作学习AI助手“通义听悟”,于6月1日开始正式公测。
产品概况
「通义听悟」简称听悟,是聚焦音视频内容的工作学习AI助手,依托大模型,为每一个人提供全新的音视频体验。
通义听悟可以在会议、学习、访谈、培训等场景下:
实时记录交流内容,同步翻译
批量转写音视频文件,区分发言人
智能提炼全文概要、章节速览、发言总结
自动提取关键词、问题、待办事项
编辑整理笔记,导出记录
功能介绍
前往通义听悟功能学堂,一分钟玩转通义听悟。
基础功能
实时记录:开启实时记录,完整沉淀沟通内容,精准快捷生成记录,音字对应播放;
音视频转写:会议、访谈、学习等音视频文件快速上传,可同时上传多个文件,批量转写生成记录;
云盘导入:绑定阿里云盘账号,快捷转写阿里云盘音视频文件,记录文件一键转存至云盘;
翻译:支持一键开启中英互译,打破语言壁垒,轻松实现无障碍沟通;
发言人区分:支持自动区分发言人,也可以对发言人进行编辑、筛选,回顾整理更清晰;
待办事项:整理待办事项,后续安排了如指掌;
问题回顾:提取问题,快速回顾沟通内容。
高阶AI功能
全文概要:智能总结全文内容,一眼秒懂音视频概要内容;
章节速览:智能提炼章节摘要,轻松把握会话脉络,还原交流过程;
发言总结:智能概括发言内容,高效回顾发言人观点;
整理与沉淀
快速标记:高亮重点、问题、待办,重点信息一目了然;
智能替换:一键替换所有结果,在本次录音后续识别过程中自动替换目标词汇;
轻松下载:支持下载原文、笔记、音视频和译文,一键导出所需内容;支持多种下载文档格式。
公测期
2023年6月1日,通义听悟开放公测。
公测期内,包括高阶AI能力在内的全部功能,用户无需申请和排队即可马上体验。同时官网还提供了丰富的权益活动使用户能够赢取使用时长,来满足日常使用的需求。
合作产品
通义听悟当前已经与阿里云盘打通,存储在阿里云盘中的音频视频内容可以方便地导入通义听悟进行AI的分析和理解,在云盘内在线播放视频时也可自动匹配字幕。绑定阿里云盘账号的听悟用户可以共享阿里云盘超大存储空间,进行个人音视频的管理。
同时通义听悟的小程序版后续将在钉钉、阿里云盘等阿里旗下产品中推出,并与这些产品内部的场景功能及音视频内容融汇贯通。同时,通义听悟的AI能力也将进一步服务于阿里巴巴内部各类应用,如广受用户欢迎的“钉钉闪记”背后便集成了有关能力。
完结撒花
全民百科词条内容由用户共同创建和维护,不代表全民百科立场。如果您需要医学、法律、投资理财等专业领域的建议,我们强烈建议您独自对内容的可信性进行评估,并咨询相关专业人士。