关闭广告

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家268人阅读

IT之家 2 月 4 日消息,上海 AI 实验室今日(2 月 4 日)宣布开源基于“通专融合”技术架构 SAGE 打造的万亿参数科学多模态大模型 Intern-S1-Pro


上海 AI 实验室表示,作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro 的核心科学能力实现了跃升,高难度综合学科评测稳居 AI4S 领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。


该模型基于混合专家架构(MoE),共拥有 512 个专家,总参数达 1T,每次调用仅激活 8 个专家、22B 参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:

  • 在 SAGE 的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;
  • 通过高效路由机制,系统攻克了训练万亿参数 MoE 模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了工程基础。

与此同时,Intern-S1-Pro 验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的 AGI4S 基础设施奠定了底座。

IT之家附 Intern-S1-Pro 开源地址如下:

  • 在线体验链接:https://chat.intern-ai.org.cn/
  • GitHub 链接:https://github.com/InternLM/Intern-S1
  • HuggingFace 链接:https://huggingface.co/internlm/Intern-S1-Pro
  • ModelScope 链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S1-Pro
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

向太曝郭碧婷父亲患病或时日无多,儿媳长期留台,私房钱贴补娘家

不八卦会死星人 浏览 464

苏亚雷斯:有信心率领亚泰保级

体坛周报 浏览 442

医生手术时涉诈停机 20多天未能复机无法与病人联系

中国新闻周刊 浏览 500

辛纳2-0德米纳尔,12连胜对手晋级ATP500维也纳站决赛

懂球帝 浏览 460

先L3还是直接L4?国内车企还在争论,特斯拉已经“空车”上路了

Autolab 浏览 363

从0度穿到20度,这件衣服才是今年冬天的“顶流”!

LinkFashion 浏览 351

大S纪念雕像正式揭幕!超10位明星出席,前男友周渝民也现身了

萌神木木 浏览 276

2050年人形机器人市场规模达5万亿美元,每10人就有1台

环球网资讯 浏览 375

强奸大嫂凶手出狱去大嫂家 大嫂吓得穿内衣跑街上求救

澎湃新闻 浏览 340

伊姐周日热推:电视剧《重影》;电视剧《山河枕》......

伊周潮流 浏览 479

Qt 与华为合作,跨平台快速开发开源鸿蒙 OpenHarmony 应用

IT之家 浏览 16887

WLTC纯电续航180km 比亚迪海獭正式亮相

车质网 浏览 476

新增双色特别涂装 全新宝马X7将2027年上市

车质网 浏览 269

每体:加维可能随巴萨前往沙特,为参加西超杯队友加油助威

懂球帝 浏览 333

拜仁官方:后卫斯塔尼希奇今日回归合练

懂球帝 浏览 456

邵佳一:我们应该配得上三分,在休息室里我祝贺了队员们

懂球帝 浏览 439

“小黑靴”今年冬天又火了!这4组搭配照着搭就很时髦

LinkFashion 浏览 456

以军先斩后奏空袭加沙多地 特朗普:以色列没做错

上观新闻 浏览 475

60+女性穿搭“高级感”秘诀:4个日常技巧,轻松美出优雅气质

静儿时尚达人 浏览 315

2天挨4 针,韩国皮肤科,挤满“特种兵医美”的中国人

每日人物 浏览 445

50+女性秋季穿搭新思路:告别卫衣,这4类上衣让你显嫩又有质感

静儿时尚达人 浏览 471
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2024,版权所有 xingchentong.com
沪ICP备20017958号-8