2024-12-11 数码 0
科大讯飞「星火」大模型,智慧涌现的新篇章
在2021年中国十大科技新闻事件中,最具希望实现智慧涌现的公司之一是科大讯飞。从成立之初,它就明确了自己的使命:要么率先燎原,要么率先熄灭。在这个过程中,科大讯飞不仅提供了语音输入和故事要求,还允许用户选择喜欢的合成声音和虚拟人形象,将故事说给孩子听。
会场外,机器之心也没有闲着。我们以《麦田守望者》为题,对「星火」进行了一次创作挑战,让它创作一首现代诗歌和古代绝句,这样的作品令人印象深刻。现在,科大讯飞甚至化身婚礼策划,为窦骁和何超莲举行一次婚礼策划,这是否能激发窦骁对婚礼策划的大模型获取灵感?
这是一个关于界面与《翦商》作者李硕专访的机会。
机器之心继续考验:
二、由「1」生「N」:大模型落地应用的领先者
图片社交软件Instagram积攒过亿用户数用了2.5年,而TikTok只用了9个月,而ChatGPT只用了两个月。其爆火主要是因为它撬动了最具规模效应的C端——提供一个便捷易用的交互界面,让普通人都能使用。
对于C端产品,大模型重要价值在于提升后端理解能力,当与前端听、说能力融为一体后,将极大提升每一个智能终端的人机交互体验,使得后者的便捷性、自然性和深度得到显著提升。
科大讯飞已拥有智能录音笔、翻译笔、智能办公本等诸多C端产品,将其能力下放到这些产品矩阵中,以达到一种规模效应,再自然不过。
客户真实使用反馈非常重要,基于真实场景数据最能验证模型性能。既然模型需要长时间持续跟随客户反馈不断调优,那么C端能够更快卷起这个闭环。
正如科大讯飞表示,现在还没有一家国产的大模型面向公众开放,让所有人都可以体验。它们推出的这些功能都是产品级,只有购买相应硬件的用户才能立刻获得体验。
下半场首先登场的是教育领域,是最具想象力和应用前景的一个垂直领域。这包括AI学习机等产品,它们被寄予未来百亿营收规模厚望。而目前,科大讯飞已经形成高、中低级别学习机系列完整布局。
不过,消费者很难明确体验感知到智能服务及其效果,在业内看来,未来市场增长关键点之一在于能否实现智能服务体验上的跃升,大型AI系统出现可以实现这一点。
发布会上搭载认知技术的大型AI学习机T20系列可实现中英文作文类批改,可做到写作思路启发,并且生成片段优化参考建议提升,让孩子在启发中精准提升。此外,还可以形成会议纪要总结重点关注内容,以及提出写作建议。这不仅需要自然语言理解能力,还需要文本生产能力,一键即可完成。
当我们从生态角度来看产业落地想要尽快让不同行业中的“星火”技术落地并迭代,那么必须发动群众,这也是“星火”燎原途径的一部分。
目前开发者数量已达380.5万,他们通过API调用等方式获得“星火”各项能力,同时还为平台带来了大量文本语料及用户反馈数据促进迭代。此外,无论是学习设备还是数百万开发者,当他们与设备或开放平台不断交互时产生大量数据又能反哺给模型进一步提高理解力,不断更新迭代。
随着大量专业领域语料积累以及实际场景应用,它们再通过知识衔接在统一训练的大型AI系统中,从而促进通用领域智慧涌现,并整体提升逻辑推理能力。这恐怕也是为什么有信心在中文领域通用认知AI系统实现智慧涌现,同时领导教育、办公、医疗等行业发展底气所在。
接下来,“星火”将有三轮迭代,每次都会更加精细化、大胆创新,为未来的产业发展奠定坚实基础。在核心技术方面,我们始终保持国际领先水平,在常识推理攻坚阶段取得重大突破,其中OpenBookQA夺冠后,其对夺冠系统X-Reasoner升级改造再次夺得QASC榜首,即全球首次超越人类平均水平;此外开源超过40个通用领域中文预训练语言库,每日调用量超1000万,在GitHub平台获得star数位列同类第一名远超第二名。
除了核心算法积累之外,多年认知智能研发推广期间共计50TB行业语料积累,每天10亿人次活跃应用,也成为其独特优势之一。而业务内容决定他们拥有更多的是教育医疗垂直领域数据(比如文本数据及用户反馈),深入行业应用保证高质量数据这也是认知AI模块实现多轮对话逻辑推理不可或缺燃料来源。