世界观察:学而思将于年内推出自研大模型MathGPT,面向全球数学爱好者及科研机构
(资料图片)
蓝鲸教育5月5日讯,日前,学而思宣布正在进行自研数学大模型的研发,命名为MathGPT,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心。目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。
据悉,学而思已将MathGPT作为公司核心项目,由CTO田密负责。学而思方面表示,今年春节前,该项目已经启动相应的团队建设、数据、算力准备和技术研发。此外,学而思已经启动在美国硅谷的团队建设,将成立一支海外算法和工程团队,在全球范围内招募优秀的人工智能专家加入。
如何利用大语言模型服务各行各业是当下社会的焦点问题。比如在教育领域Duolingo、Quizlet、可汗学院等产品主要和OpenAI合作,在GPT大模型上做微调和接口调用,增强原有的产品体验。但也有一些领域如数学、医学等,对AI的需求是准确、清晰、具备强大的逻辑推理能力,且容错率低,通用LLM目前的性能表现还无法在上述领域取得突破,未来是否可能取得突破尚不清晰。
以数学领域为例,目前市场上有几个主要流派。比如Google收购的Photomath、微软数学、Mathway、专注数学计算的WolframAlpha等产品,主要利用非LLM的传统AI技术加上数据库的方式解决数学问题。走AGI路线的公司则尝试让通用LLM“更懂数学”,比如GPT4在数学任务上比之前的3.5版本性能更好,谷歌旗下的Minerva模型也专门针对数学问题进行调优。学而思选择了另一条少有人走的路,不基于现有LLM做微调和接口调用、不做通用LLM,而是自研基于专业领域的“数学大模型”MathGPT,致力于打造自主、稳定、可持续、高质量的学习解决方案。
对于自研MathGPT的初衷,学而思方面表示,美国OpenAI公司在今年三月份发布了大语言模型GPT-4,国内百度、阿里也发布了各自的大模型产品,但通用语言模型更像一个“文科生”,在语言翻译、摘要、理解和生成等任务上有出色表现,而在数学问题的解决、讲解、问答和推荐方面则存在明显不足:解答数学问题经常出错,有些数学问题虽然能够解决,但方法更偏成年人,无法针对适龄孩子的知识结构和认知水平做适配。
“这种不足是由LLM模型的自身特点决定的。”学而思AI团队负责人介绍,LLM大模型来自对海量语言文本的训练,因此最擅长语言处理。行业内偏向基于LLM大模型做阅读、写作类应用,但如果想要在数学能力上有突破,就需要研发新的大模型。因此,学而思决心组建团队专研MathGPT——数学领域大模型,用自己在数学和AI上的多年积累,面向全球范围内的数学爱好者和科研机构,做好AI大模型时代的数学基础工作。
学而思希望通过MathGPT弥补和攻克大语言模型的三个问题:第一,题目要解对,现在GPT结果经常出现错误;第二,解题步骤要稳定、清晰,现在GPT的解题步骤每次都不一样,而且生成内容经常很冗余;第三,解题要讲的有趣、个性化,现在GPT的解释过于“学术”和机械,对孩子的学习体验很不友好。
在大语言模型不断进化的浪潮下,不同的技术路线选择孰优孰劣,仍有待讨论和验证。学而思自研独立的MathGPT大模型是否成立,是否能够超越通用模型在数学任务上的表现,是否更匹配不同人群的数学学习场景,这个问题还需要在创新实践中寻找答案。随着整个行业的深化发展和越来越多人才参与到这个领域,相信不久的将来就能看到更为成熟的解决方案。
学而思方面称,学而思“以数学起家”,至今已有20年的数学教学经验,积累了庞大的数学相关数据,这些数据是进行MathGPT训练的必备物料。另外,学而思的海外业务Think Academy在全球若干国家和地区深受数学爱好者喜欢,学而思的学生在每年的IMO和AMC等国际数学竞赛中表现优异,每年都有多位学生在国际奥林匹克数学竞赛中拿到金牌。所以,学而思选择在MathGPT方向发力也顺理成章。
另据了解,学而思学习机近期将会上线一款“AI助手”,涵盖作文助手、口语助手、阅读助手、数学助手等相关功能,该AI产品将于5月11日开启内测。
关键词:
上一篇:年报里的数字中国:核心公司业绩谁最强?大资金最爱谁?
下一篇:最后一页
精心推荐
- 如何把旧电脑的数据转移到新电脑上?
- 2023年浙江队主场继续落户湖州
- 医疗器械板块1月10日涨1.48%,春立医疗领涨,北向资金增持3.51亿元_天天头条
- 描写草莓搞笑的句子(精选275句)_当前焦点
- 泛亚微透(688386):泛亚微透关于持股5%以上股东减持比例达到1%的提示性公告
- 今热点:广州检方五年来追偿修复生态、治理环境费用3.39亿元
- 小鲨易贷逾期1天会上征信系统吗
- 【光明图刊】温馨服务护航旅客回家路
- 异质结电池HJT板块1月9日涨0.07%,杭萧钢构领涨,主力资金净流出8.7亿元
- e点贷借款逾期拖欠多久上征信 全球快播报
- 海天味业的成本之压:毛利率连年大降,净利润下行态势能否止住?
- 昌平区普通工伤如何计算_天天资讯
- 热点评!Notion 很好,但我已经换到了钉钉文档
- 时讯:【与时代同梦与梦想同行】秦一(小一姐姐):我愿讲述最美的中国故事
-
1、确保小猫至少八周大,洗澡不适合八周以下的猫。在八周之前,母猫将满足小猫的大部分梳理需求。2、先将小猫的身体弄湿,将小猫放入水槽,防
-
调查:脱贫地区乡村儿童家庭规模平均5人,多为“父养母教”
-
个人分析,玉米长期多头趋势尚难寻踪迹,目前行情应以反弹趋势对待,短期操作谨慎追多。第一,据Mysteel农产品12月29日-1月4日数据,全国146家
-
就是这个味道,而且它不止有玫瑰香,还有奶香,这是一种复合型的味道。一串阳光玫瑰的重量,是可以达到600克的,最大的能达到1 8kg,平均果粒
-
文|阑夕时间过得真快,上次这么醒来点亮手机,还是在去年。有人说刚刚结束的不是2022年,而是2020年的第3季,至于2023会是续订的第4季,还是彻
X 关闭
X 关闭
产业
-
不用跑北京 在家门口也能挂上顶...
日前,我省首个神经疾病会诊中心——首都医科大学宣武医院河北医院...
-
“十四五”期间 河北省将优化快...
从省邮政管理局获悉,十四五期间,我省将优化快递空间布局,着力构...
-
张家口市宣化区:光伏发电站赋能...
3月19日拍摄的张家口市宣化区春光乡曹庄子村光伏发电站。张家口市宣...
-
“张同学”商标被多方抢注 涉及...
“张同学”商标被多方抢注,官方曾点名批评恶意抢注“丁真” ...
-
山东济南“防诈奶奶团”花式反诈...
中新网济南12月15日电 (李明芮)“老有所为 无私奉献 志愿服...
-
广州新增1例境外输入关联无症状...
广州卫健委今日通报,2021年12月15日,在对入境转运专班工作人...
-
西安报告初筛阳性病例转为确诊病例
12月15日10:20,经陕西西安市级专家组会诊,西安市报告新冠病毒...
-
广东东莞新增本土确诊病例2例 ...
(抗击新冠肺炎)广东东莞新增本土确诊病例2例 全市全员核酸检测...
-
中缅边境临沧:民警深夜出击捣毁...
中新网临沧12月15日电 (胡波 邱珺珲)记者15日从云南临沧边境...
-
“土家鼓王”彭承金:致力传承土...
中新网恩施12月15日电 题:“土家鼓王”彭承金:致力传承土家...