关闭广告

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家270人阅读

IT之家 2 月 4 日消息,上海 AI 实验室今日(2 月 4 日)宣布开源基于“通专融合”技术架构 SAGE 打造的万亿参数科学多模态大模型 Intern-S1-Pro


上海 AI 实验室表示,作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro 的核心科学能力实现了跃升,高难度综合学科评测稳居 AI4S 领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。


该模型基于混合专家架构(MoE),共拥有 512 个专家,总参数达 1T,每次调用仅激活 8 个专家、22B 参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:

  • 在 SAGE 的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;
  • 通过高效路由机制,系统攻克了训练万亿参数 MoE 模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了工程基础。

与此同时,Intern-S1-Pro 验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的 AGI4S 基础设施奠定了底座。

IT之家附 Intern-S1-Pro 开源地址如下:

  • 在线体验链接:https://chat.intern-ai.org.cn/
  • GitHub 链接:https://github.com/InternLM/Intern-S1
  • HuggingFace 链接:https://huggingface.co/internlm/Intern-S1-Pro
  • ModelScope 链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S1-Pro
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

Melody和林依晨,怎么不会老啊?

时尚COSMO 浏览 452

袋泡茶品牌茶里成“老赖”,被执行超1.4亿元,有员工被拖欠工资超一年

红星资本局 浏览 325

以色列总理称拒绝哈马斯提出的停火要求

央视新闻客户端 浏览 3557

告别8GB时代!iPhone 18将升级为12GB内存:苹果已提前采购

快科技 浏览 463

消息称鸿蒙智行均价近 40 万元,每 2 分钟卖一台车对市场冲击大

IT之家 浏览 468

曝奔驰考虑与长城汽车共享南非工厂

盖世汽车 浏览 219

合资巨头挥起价格屠刀,2026年车市谁主沉浮?

禾颜阅车 浏览 199

全运男足U20:浙江、新疆成绩完全相同,需抽签决定晋级球队

懂球帝 浏览 445

黄宗泽哭着拿双料视帝,10次提名终于熬出头

手工制作阿歼 浏览 331

印巴空战震撼全球:PL-15导弹为何一击必杀

浏览 966

穿了十年仍然心动的外套,它算一件

黎贝卡的异想世界 浏览 321

伊姐十一热推:电影《震耳欲聋》;电视剧《三更雪》......

伊周潮流 浏览 472

电动Jeep曝新国产计划:或使用猛士技术,首车在2027年上市

明镜pro 浏览 438

伊朗外长:利用阿联酋发动攻击“完全不可接受”

国际在线 浏览 201

大学生从上海坐公交车到漠河 15天车费花了1500元

新民周刊 浏览 3531

特朗普称是自己让大家变得更富有:我的敌人也过得很好

红星新闻 浏览 397

每天干十几个小时,月赚五六千元,有人6万元盘下,几个月后2万多才脱手!曾经爆火的创业项目遭嫌弃

都市快报橙柿互动 浏览 328

历史首次,“三桶油”收盘全部涨停!

红星资本局 浏览 262

麻省理工学院发明防篡改 ID 标签:成本低、尺寸小、防伪强

IT之家 浏览 16849

顶流复工,已判若两人

她刊 浏览 103

疑似遭无人机入侵 以色列北部多处响起防空警报

北青网-北京青年报 浏览 3311
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2024,版权所有 xingchentong.com
沪ICP备20017958号-8