10月24日至29日,第六届世界声博会暨2023科大讯飞全球1024开发者节在合肥举办。本届活动以“解放生产力 释放想象力”为主题,举办主论坛、AI开发者大赛、科博展、17场行业论坛、16场城市峰会等系列活动,还有来自278个城市的超3.4万个开发者团队角逐2023届AI开发者大赛十佳团队。
在今天的开幕式主论坛上,科大讯飞正式发布“讯飞星火”认知大模型V3.0,七大维度能力全面提升,大模型代码能力迭代升级。据科大讯飞董事长刘庆峰介绍,星火认知大模型V3.0已经超越了ChatGPT(GPT3.5)。
他进一步解释称,根据《通用认知智能大模型评测体系》构建测试集,在10月16日至20日的测试中,星火认知大模型V3.0的中文能力客观测评超越ChatGPT,而根据OpenAI在官网发布的英文任务测试集,在10月16日至20日的测试中,星火V3.0的英文能力对标ChatGPT48项任务结果相当,二者得分分别为85.1%(星火V3.0)和84.3%。
根据现场的演示,星火认知大模型V3.0相比上一版本在文本生成、逻辑推理、代码能力等七个方面的能力有了3%到9%不等的提升。不过,刘庆峰也表示,和GPT4相比,科大讯飞“还有一个学习的过程”。
刘庆峰表示,认知大模型正在开启一个增长新时代,大模型正日益与每个人息息相关。刘庆峰指出:“在当前全球政治、经济军事面临巨大挑战和不确定前提下,通用人工智能是这个时代最确定的增长动力来源。”
此外,科大讯飞全新发布了Al心理伙伴产品,致力于陪伴孩子成长;首次发布科技文献大模型,为科研工作者提供助力,同时还发布了星火医疗大模型,并首发医疗大模型加持下的“讯飞晓医”APP及小程序。据介绍,讯飞星火医疗大模型已通过信通院和国家卫健委组织的标准规范评测。刘庆峰表示,星火医疗大模型在医疗海量知识问答、医疗复杂语言理解、医疗专业文本生成、医疗诊断治疗推荐的问题解答率等方面全面超越GPT-4。