科大讯飞深入大模型国产化“无人区”,智算平台“飞星二号”正式启动
“只有在真正自主可控的平台上,才有真正的中国人工智能大未来。”
10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节开幕式上,科大讯飞(002230.SZ)董事长刘庆峰公布讯飞星火大模型应用成绩单,并发布讯飞星火4.0 Turbo:七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o,国内外中英文14项主流测试集中讯飞星火4.0 Turbo实现9项第一。
据悉,为了帮助各行各业更好地落地大模型,科大讯飞构建了从“建算力、理数据、训模型,到落场景、保安全、精运营”的全套解决方案。
“科大讯飞有领先的工具链,可大幅提升‘理数据、训模型’的效率;有覆盖300+行业场景的实际应用案例,已形成相互借鉴和复用的规模化效应;还有全国产化的算力平台。”刘庆峰说。
能力再度升级
据刘庆峰介绍,根据实用数学任务构建测试集CAppliedMath-1.0,讯飞星火4.0 Turbo在计算、财务、金融、度量等多个维度的任务中均超过GPT-4o水平,已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类“o1”的高难度数学能力显著提升。
语音识别领域,科大讯飞的远场高噪场景语音识别领先优势进一步扩大。在多语言能力上,首次实现全国地级市方言全覆盖,含全国288个地市、202种方言,讯飞输入法14.0即将支持202种方言免切换自由说。在多语种能力上,首次发布星火多语言大模型,除中英文外,可支持俄、日、阿、法等8个语种。根据实用任务场景构建测试集MMT-Eval-1.0,讯飞星火在汽车、家电、办公、翻译等行业的任务场景应用效果超过了GPT-4o。
模型能力迅速提升的同时,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。
去年10月24日,首个国产万卡算力集群“飞星一号”平台上线,星火大模型持续引领全国产算力平台发展,刘庆峰介绍一年以来攻克了很多‘疑难杂症’,解决了500次以上的基础软硬件问题和模型适配问题。
“飞星二号”将带来新模型新算法的持续适配和智算集群规模的再次跃迁,持续探索无人区、引领国产大模型底座的发展、给世界提供第二选择。“只有在真正自主可控的平台上,才有真正的中国人工智能大未来。”
赋能民生刚需
“用人工智能技术解决社会刚需”,是科大讯飞一直以来的出发点之一。会上,基于讯飞星火底座能力,科大讯飞面向教育、医疗、司法、政务服务、企业办公等多个行业场景发布了最新的产品应用。
在教育行业,首次发布基于“问题链”的高中数学智能教师系统。此次发布的高中数学智能教师系统,可以智能生成教学问题链,以循序渐进的方式辅助教师启发学生思考并逐步解决问题,同时基于精准学情定位学生薄弱点、融合最近发展区规划路径、鼓励学生基于真实世界的主动提问、探究式学习,帮助学生实现知识、到能力、再到素养的综合培养。
在医疗行业,基于讯飞星火医学影像大模型打造的智能医学影像助手正式发布,在智能质控环节,可帮助影像技师快速评估图像质量,及时纠正检查问题;在智能诊断环节,可帮助影像医师快速生成诊断报告,解释溯源并多期对比;在智能读片环节,可接入医学影像大模型,通过相关问答,帮助临床医师制定诊疗方案。
在政务服务场景,政务大模型持续迭代,全面覆盖4500多种标准化事项和60多种材料,老百姓和政务大模型“聊天”就能实现边聊边确认办事意图,审核时间缩短80%,登记效率提升5倍。此外,发布会上首发了搭载政务大模型的“星火智办一体机”,方便群众从“问着办”到“领着办”。
“讯飞星火已成为央国企大模型的第一选择。”刘庆峰晒出了大模型应用成绩单:央国企中标第一、教育医疗市场第一、智能汽车市场第一、大模型开发者生态第一、智能硬件市场第一、赋能科研应用第一、赋能工业应用第一。
截至2024年10月,科大讯飞已与各头部企业共建20多个行业大模型,覆盖300+应用场景,所覆盖行业和场景数都是第一。