关闭广告

AI大战打到太空!前脚H100入轨,TPU后脚上天,中国玩家笑而不语

量子位129人阅读

  • 克雷西 发自 凹非寺
    量子位 | 公众号 QbitAI

英伟达和谷歌,抢着上天了!

搭载英伟达H100的卫星已经在这个月被送入太空,谷歌这边也不甘落后——

CEO劈柴哥表示要把TPU也发射上去,最早的两颗卫星2027初启程。



未来,两家都打算在太空建立起吉瓦级的数据中心。

网友表示,在太空部署算力的想法真的很酷。



不过这个赛道上,领先的既不是英伟达也不是谷歌,而是一家来自中国的公司,更早之前就已经开启了太空算力布局。

AI芯片要上天了

英伟达芯片上天,主要是由Inception计划孵化的初创公司Starcloud执行。

本月刚刚发射的Starcloud-1卫星搭载了H100,重60公斤,大小与小型冰箱相当。

之所以选择英伟达芯片,是因为Starcloud需要具备与地球数据中心相媲美的性能,而英伟达GPU在训练、微调和推理方面性能最佳。

Starcloud-1将接收来自合成孔径雷达(SAR)卫星群的数据,并在太空中对这些数据进行实时处理然后传回地球。



同时Starcloud还是Google for Startups Cloud AI Accelerator计划的“毕业生”,计划在轨道上使用H100运行谷歌的开源模型Gemma,证明大型语言模型在外太空运行的可行性。

Starcloud最早将于明年启动商业服务,后续还计划把Blackwell也送入太空,终极目标是建造一个功率达5吉瓦、跨度约2.5英里(约4公里)的轨道数据中心。

CEO Philip Johnston还预言,10年之内,新建的数据中心将全部建在太空。



谷歌这边起手稍晚了些,计划把自家的TPU送上太空,两颗原型卫星预计在2027年初发射。

谷歌把该计划命名为“太阳捕手计划”(Project Suncatcher)。



原因是计算星座中的卫星将全部通过太阳能供能,之间的通信链路也是通过自由空间光通信实现。

最早的两颗原型卫星将测试谷歌TPU在太空中的实际运行情况,同时对光通信链路进行验证,探索其执行分布式机器学习任务的可行性。

远期来看,谷歌的终极目标,也是在太空中建成吉瓦级的数据中心。

太空部署的优势和挑战

关于在太空中部署算力设施的优势,两家都进行了论证,谷歌甚至还为此专门发了一篇论文。



首先就是成本优势,Starcloud这边给出的数字认为,即使算上发射费用,太空能源成本也仅有陆基方案的1/10。

谷歌这边则给出了更具体的计算。

假设LEO发射成本降至每公斤200美元,则卫星的单位电力年均成本可降至810美元每千瓦年,与当前美国数据中心570到3000美元的电力成本区间相当。

并且发射成本呈现下降趋势,以SpaceX为例,历史数据显示其每年发射载重量翻倍,单价下降20%,若维持此曲线,预计2035年前可将每公斤的发射成本降低至200美元以内。

而当马斯克星舰实现重复使用时,发射成本有望降至每公斤60美元甚至15美元,成本持续且加速下降。

成本低的一个重要原因,就是电力更容易获取——

谷歌论文显示,太阳的能量输出超过人类总发电量的100万亿倍,在合适的轨道上,太阳能电池板的效率可比在地球上高出8倍,并且几乎可以持续发电,从而减少对电池的需求。

再来就是散热,与许多地球上的数据中心依靠蒸发塔利用淡水进行冷却不同,Starcloud的太空数据中心可以利用深空的真空作为无限的散热器。

英伟达与Starcloud联合开发了真空散热架构,通过卫星外壳的高导热材料将H100的热量传导至表面,再以红外辐射形式排向太空。

此外就是卫星数据的在轨处理——其他卫星所产生的数据,如果传回地面再做计算将耗费大量通信资源,有了天基卫星之后可以在轨完成运算,只把运算结果进行回传,从而减轻通信压力。

Starcloud对SAR卫星数据的处理,就是对这一路径的一种尝试。

谷歌这边还进行了更多验证。

比如通信链路,使用现成DWDM模块(如400G PM-16QAM光模块),在实验中已成功实现800Gbps单向(1.6Tbps双向)短距光通信,证明此类模块可用于小尺度卫星集群。

还有大规模卫星的控制,谷歌的模型显示,只需要适度的轨道保持机动,就维持星座的稳定运行。



还有TPU对辐射的耐受性,谷歌表示,即使是敏感的HBM组件也要在在累积剂量达到2000rad(Si)后才开始出现异常,这一数值几乎是预期五年任务剂量的三倍。

所以总的来说,天基机器学习计算的核心概念并未受到基本物理定律或不可逾越的经济障碍的限制,但也仍然存在诸多重大的工程挑战,例如热管理、高带宽地面通信以及在轨系统可靠性。

国产算力卫星已常态化商用

Starcloud这边刚把H100送上天,谷歌的TPU更是要等上一年多才能进入太空,但此时中国首个太空算力星座已经发射快半年了。

今年5月,之江实验室“三体计算星座”的首批12颗卫星已被送入预定轨道。

这十二颗计算卫星,每颗卫星均具备太空计算、太空互联的能力,还搭载了之江实验室承担研制的星载智能计算机等太空计算软硬件和天基模型,实现了“算力上天、在轨组网,模型上天”。

相比于传统的应用型卫星,计算卫星将单颗卫星的计算能力从T级提升至P级,首发星座在轨计算能力达到5POPS,极大地提升了单星高性能太空计算的能力。

这些卫星还能形成“互联网”一样的互联互通,卫星之间使用激光通信,通信速度最高可达100Gbps。

并且今年9月,该星座已经实现了常态化商业运行。

现在,随着英伟达和谷歌的加入,这场太空AI竞赛也越来越精彩了。


[1]https://blogs.nvidia.com/blog/starcloud/?linkId=100000388085273
[2]https://research.google/blog/exploring-a-space-based-scalable-ai-infrastructure-system-design/

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

5天破3亿!“屌丝”大鹏,不愿学沈腾

金错刀 浏览 2769

点读机女孩评论区沦陷!被扒模糊患病时间线炒作,网友呼吁彻查

萌神木木 浏览 2882

美前驻华大使不装了:凭啥和中国组G2划"势力范围"

观察者网 浏览 175

卡拉格:曼城表现得很好,阿森纳会在英超冠军争夺中感到紧张

懂球帝 浏览 120

洞庭湖决口合龙 专家:15个西湖的滞留水预计排十余天

每日经济新闻 浏览 3068

科技巨头疯狂投资AI基建,芯片厂商吞了云服务企业的利润?

澎湃新闻 浏览 154

Unity 中国官宣与零跑汽车合作,打造下一代智能座舱交互体验

IT之家 浏览 129

音频实证日本有意滋扰中方训练

玉渊谭天 浏览 8

为何林心如被誉为国内演艺界无可挑剔的典范?

小椰的奶奶 浏览 54

42岁郭晶晶奥运主题杂志大片曝光,穿大码西装,梳大背头又美又飒

娱絮 浏览 2541

中国富豪圈,正在大换血!

市值Observation 浏览 2554

高迪预测英超天王山之战:看好蓝月亮客场不败

直播吧 浏览 2782

定位中大型5座SUV 星途ET7申报图曝光

车质网 浏览 98

打工人要休闲就只能辞职回家?董明珠说得过了吗?

新民周刊 浏览 16183

百亿之后,珀莱雅失速

斑马消费 浏览 149

里程碑!祖巴茨砍下生涯第100次两双

直播吧 浏览 2840

以后请叫甄子丹为超级丹

港剧叔 浏览 151

18年赋能,李书福看中了LEVC什么

网易汽车 浏览 2622

美乌总统再度激烈争吵 特朗普爆粗口还把地图给扔了

扬子晚报 浏览 196

以军已停止在加沙地带军事行动

财联社 浏览 145

迪马济奥:亚特兰大中卫斯卡尔维尼左腿屈肌拉伤,将缺阵3周

懂球帝 浏览 154
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2024,版权所有 xingchentong.com
沪ICP备20017958号-8