开元APP9月7日,正在2023腾讯环球数字生态大会上,腾讯混元大模子正式公布。早正在公布会前一天,腾讯就仍然揭示了其合系定名和图标。
腾讯集团高级奉行副总裁、云与聪慧资产奇迹群CEO汤道生暗示,腾讯将迈入“全盘拥抱大模子”时期,他指出,大模子需求基于资产场景,与企业数据统一,才智开释出最大的代价,“腾讯将藏身于异日,藏身于实效,让数字化器械正在资产顶用起来、用得好超越。
从2021年起初,腾讯先后推出千亿和万亿参数的NLP稀少大模子,突破CLUE三大榜单记载,告竣正在中文分解才华上的新冲破。近期,腾讯的混元AI万亿大模子登顶巨头中文测评基准CLUE榜首并超越人类程度。
目前,腾讯混元大模子参数范围超千亿,预磨练语料超2万亿tokens,具有重大的中文创作才华、丰富语境下的逻辑推理才华以及牢靠的职司奉行才华。
罕见据显示,混元大模子采用腾讯太极机械进修平台自研的机械进修框架,太极AngelPTM磨练框架的磨练速率比拟业界主流框架提拔1倍,AngelHCF推理框架的推理速率比业界主流框架提拔1.3倍。
其余,混元大模子依托于腾讯当先的根基办法,腾讯云星星海自研任事器、腾讯云高本能算力集群本能提拔3倍,自研星脉高速汇集3.2T通讯带宽,告竣10倍通讯本能提拔超越。
基于此,混元大模子正在算法层面实行了一系列自研更始,普及了模子牢靠性和成熟度。
针对大模子展示的“幻觉”题目,腾讯优化了预磨练算法及政策,让混元大模子的幻觉比拟主流开源大模子低落了30%至50%;
通过深化进修的形式,让混元大模子学会识别陷坑题目,对担心全题目说“不”,面临安宁诱导类题目标拒答率提拔20%;
通过名望编码优化,普及了超长文的措置成果和本能,联络指令追随优化,让产出实质更合适字数条件,提拔超长文本的天生和续写才华;
腾讯提出思想链的新政策,有用深化模子对题目标拆解和分步推敲的偏向超越,让利用帮手可能像人一律联络实践的利用场景实行思想推理。
正在现场演示中,腾讯并没有对混元大模子实行现场的“刁难”测试,而是通过5个浅易的题目,揭开了混元大模子的“奥密身份”。
从现场演示显现出的少许消息可能看到,混元大模子的中央架构基于Transformer,实行多轮迭代,并拥有肯定挪用表部插件器械的才华;参数目抵达千亿级别,暂时版本的混元大模子常识截止到2023年7月,正在现场中超越,腾讯集团副总裁蒋杰还提到混元大模子的常识库还将连接更新,将实行每月迭代。
而正在第5个题目中,演示任务职员打错“特色”做“拿手”,混元大模子也可能实行矫正分解。
蒋杰还正在现场出题,检验混元大模子正在实践场景中是否具备逻辑推理才华:“买一堆咖啡,上午喝了一半,下昼又喝了剩下的一半,这时还剩30杯,一共买了多少杯”
正在信通院测评中,混元大模子正在模子拓荒测试29个才华项,模子才华测试37个才华项超越,归纳评级4+级,获暂时最高分。并正在中文理科高考题子项、数学题子项均超越GPT4。
目前,混元大模子已告竣与腾讯聚会、腾讯文档、腾讯告白、腾讯游戏、腾讯金融科技、微信搜一搜、QQ浏览器等赶过50个腾讯交易和产物联络,并得到初阶成果。
此中混元大模子正在告白场景中的利用,告竣适宜行业与地区特点、知足千人千面条件以及文字、图片、视频的天然统一,蒋杰更是暗示混元大模子超越Midjourney、赶过开源的SD模子。不需争抢,混元+交易打造腾讯工夫底座
此前,马化腾曾暗示腾讯不急于推出大模子半造品。此次,腾讯集团副总裁蒋杰将当下推出的混元大模子,界说成一个“可用”“可试验”的版本。
蒋杰暗示,大模子的发扬不行也不会只靠烧钱胀舞,肯定需求落地到全部的场景形成代价,落的场景越多,应用的用户越多,形成的贸易代价、数据越多,通用大模子的磨练本钱就会被摊的越薄、推理本钱也就降的越低,而模子才华却会更强
正在公布会上,腾讯发布混元大模子今日起对表绽放,用户可通过腾讯云实行体验,接济直接挪用 API 接口,或者将混元举动基底模子,正在公有云前实行精调超越。
目前的混元大模子版本接济多轮对话、实质创作、逻辑推理开元APP、常识加强等成效,多模态文生图也将正在后续上线。
收费方面,腾讯混元大模子将为每个正在白名单中的已实名腾讯云企业账号供给累计10万 token的免费挪用额度,开明任过后即可应用。正在免费额度用完后,按如下价值实行计费:腾讯混元大模子高级版每1000 token收费0.14元。(注:1token约等于1个中文汉字或3个英文字母)
蒋杰正在继承媒体采访时暗示,原来即日腾讯大模子的利用便是跟腾讯交易的深度联络,即日是和腾讯聚会的联络超越,与腾讯文档的联络,那异日可能是跟微信的联络,QQ、腾讯视频、腾讯音笑等的联络。
清华大学人为智能咨议院视觉智能咨议核心主任邓志东暗示,大模子的代价正在于利用。唯有正在多样化的实践利用场景中赋能智能经济与智能社会的发扬,才智找到资产代价,同时也才智效果大模子本身超越。
大模子之家以为,腾讯此次推出混元大模子,是举动国内当先的工夫企业发扬的肯定,将混元大模子联络腾讯本身交易场景,可能告竣数据磨练库的连接扩充和数智化交易的提拔,帮力胀舞中国人为智能行业新发扬,同时,混元大模子的推出也是腾讯正在促进数字化转型、加疾工夫更始方面的主要步骤,混元大模子全部体现何如,让咱们沿道拭目以待!开元APP叫板GPT-4突出Midjourney腾讯混元凭什么?超越