金磊 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
瑞幸咖啡背后的芯片,藏不住了。
當你走進瑞幸咖啡店,點一杯生椰拿鐵的所有過程,例如下單、出杯、核銷、取餐……這一切的背后其實都有一雙“眼睛”在盯著。
在看什么?
它要實時識別訂單、判斷制作節(jié)奏、校驗物料狀態(tài)、監(jiān)控設備運行,還要把數(shù)據(jù)同步回總部,用于品控、調度和運營決策。
這就是藏在瑞幸咖啡背后無數(shù)的邊緣側AI,它們有一個共性,那便是算力必須就近部署,響應必須足夠快,穩(wěn)定性必須足夠強,成本還要可控。
芯片,成了其中關鍵中的關鍵。
就在今天,瑞幸背后芯片的廬山真面目終于浮出了水面——
來自一家剛剛完成上市不久的國產通用GPU公司,天數(shù)智芯。
前腳剛剛敲完鐘,時隔僅半個月時間,天數(shù)智芯便又一口氣發(fā)布了四款邊端算力產品,彤央系列。
而且不只是發(fā)布的動作,像瑞幸已經在用的邊端算力,正是彤央。
那么這個系列的產品到底實力幾何,我們繼續(xù)往下看。
一口氣發(fā)布四款新品
先來看名字。
彤央之名,源自商周青銅器銘文,但在天數(shù)智芯的內部,彤央有著別樣的寓意:
“彤”指向高能效計算能力,“央”則意味著在邊端場景中承擔核心算力樞紐的角色。
換言之,這是一個為真實業(yè)務現(xiàn)場而生的算力系列。
彤央系列的首發(fā)陣容,共包括四款產品:TY1000、TY1100,以及定位算力終端的TY1100_NX和TY1200。
先看彤央TY1000。
這是一個標準699Pin接口的模組,尺寸只有口袋大小,但在這個方寸之間,天數(shù)塞進了近200T的稠密算力。
在實際測試中,無論是典型的CV任務,還是NLP推理,甚至是對參數(shù)規(guī)模達到32B的DeepSeek-R1模型進行推理,以及具身智能VLA模型及世界模型等場景,TY1000在多項指標上都展現(xiàn)出不弱于主流國際方案的表現(xiàn)。
在天數(shù)智芯披露的測試數(shù)據(jù)中,TY1000在多類負載下的綜合效率,超過了英偉達AGX Orin所對應的典型配置。
雖然這并不意味著全面替代,但至少證明了一件事:在邊端通用推理這個維度,國產通用GPU已經具備了正面對比的能力。
其次是彤央TY1100。
這款產品在架構上進行了進一步升級,采用了12核ARM v9架構CPU,并在系統(tǒng)級算力供給上更加充沛。
它面向的是對通用計算和AI推理都有較高要求的復雜場景,比如多傳感器融合、邊緣數(shù)據(jù)預處理、實時決策等。
如果說TY1000更偏向算力核心,那么TY1100則更像是一塊完整的邊緣計算底座。
接下來,是針對對顯存容量和性價比更加敏感用戶的TY1100_NX。
更大的顯存配置,使其在多模型并行、長序列推理等場景中具備更高的穩(wěn)定性,同時維持了即插即用的部署方式,降低了系統(tǒng)集成門檻。
最后,便是彤央TY1200,則被天數(shù)智芯定義為算力終端。
它的算力規(guī)格提升到了300 TOPS,更重要的是,它是面向終端形態(tài)的整體方案。這類產品的目標用戶,并不只是算法工程師,還包括希望直接把AI能力裝進設備的行業(yè)客戶。
從產品組合上看,彤央系列并沒有走單點極致路線,而是刻意拉開了算力、形態(tài)和價格區(qū)間,覆蓋從算力模組到終端的不同部署需求。
但天數(shù)智芯并沒有把重點只放在芯片的參數(shù)上。
在生態(tài)層面,彤央系列在接口和形態(tài)上實現(xiàn)了與主流產品的Pin-to-Pin兼容,大幅降低了客戶從既有方案遷移的成本。
這一點,對于已經有成熟系統(tǒng)的工業(yè)和商業(yè)客戶來說,幾乎是“是否愿意嘗試”的分水嶺。
更重要的是,這些產品并不是為了發(fā)布而發(fā)布。
在機器人領域,彤央與格藍若機器人合作進入企業(yè)實際應用場景;在工業(yè)側,比依電器等制造企業(yè)正在用其進行設備智能化升級;在商業(yè)零售場景中,瑞幸咖啡只是其中一個典型案例;而在交通領域,彤央系列也已經參與到多個車路云一體化試點中。
當四個完全不同的行業(yè)場景,開始使用同一套通用GPU算力底座時,一個更大的問題隨之浮現(xiàn):
天數(shù)智芯真正想做的,究竟是什么?
天數(shù)智芯的“野心”也暴露了
如果只看彤央系列,很容易理解為一家國產芯片公司想要率先補全云邊端的業(yè)務版圖。
但從其同樣于1月26日公開披露的架構路線圖來看,事情顯然沒有這么簡單,在其業(yè)務大本營的云端場景,天數(shù)有更野心勃勃的目標。
天數(shù)智芯并不滿足于國產替代這個階段性目標。在多次公開場合中,它都明確提到,自己的長期目標是對標乃至超越英偉達這樣的行業(yè)標桿。
為此,天數(shù)智芯給出了一張明確到年份的架構路線圖。
2025年天數(shù)智芯推出的天數(shù)天樞架構,超越英偉達Hopper。據(jù)了解,這已經不是規(guī)劃,而是現(xiàn)實:該架構支持從高精度科學計算到AI精度計算,AI芯片在執(zhí)行注意力機制相關計算時,算力的實際有效利用效率達到90%及以上。
而測試數(shù)據(jù)顯示,天數(shù)天樞架構效率較當前行業(yè)平均水平提升60%,在DeepSeek V3場景平均比Hopper架構高約20%性能。
到2026年,天數(shù)天璇架構,新增ixFP4精度支持,對標Blackwell;天數(shù)天璣架構,實現(xiàn)全場景AI與加速計算覆蓋,超越Blackwell。
而在2027年,天數(shù)智芯規(guī)劃中的天權架構,則直接指向對Rubin架構的全面超越,重點融入更多精度支持與創(chuàng)新設計。
支撐這條路線圖的背后,還有一整套底層技術能力。
包括TPC Broadcast、Instruction Co-Exec、Dynamic Warp Scheduling在內的多項技術,構成了天數(shù)智芯在指令級并行、資源調度和算力利用率上的核心優(yōu)勢。
這些能力,決定了它是否真的具備在通用GPU賽道長期演進的可能性。
那么,天數(shù)智芯是否真的有這樣的實力?
一個直觀的判斷方式,是看通用性。
截至目前,天數(shù)智芯的通用GPU已經穩(wěn)定運行400余種主流模型,并且強調Day 0適配能力;以DeepSeek為例,其在天數(shù)智芯平臺上的適配和推理,已經成為客戶實際部署的一部分。
第二個維度,是商業(yè)化落地。
根據(jù)其公開披露的數(shù)據(jù),天數(shù)智芯累計交付的芯片數(shù)量已經超過5.2萬片,服務客戶超過300家。
在實際應用中,互聯(lián)網AI客服的算力成本被壓縮了一半,而單機性能翻倍;金融行業(yè)的研報生成效率提升了約70%;在高要求的集群場景中,其千卡規(guī)模集群已經實現(xiàn)了超過1000天的穩(wěn)定運行。
這些數(shù)據(jù)足夠耀眼,也足夠具體。
尤其值得注意的是,天數(shù)智芯在招股書中,對客戶數(shù)量、量產發(fā)貨規(guī)模、卡級毛利等核心指標進行了相對完整的披露。這種攤開來講的方式,在當前的國產芯片行業(yè)中并不多見。
也正是在這一點上,天數(shù)智芯與不少大廠自研芯片或專用NPU路線拉開了差距。
它選擇了一條更難、也更慢的路——堅持通用GPU路線,從架構、指令集、編譯器到軟件棧進行全棧自研。這意味著沒有盲區(qū),也意味著每一步都必須自己趟過去。
最后,回到瑞幸的那杯咖啡。
當國產算力開始真正進入千行百業(yè),進入門店、工廠、道路和設備,芯片不再只是發(fā)布會上的參數(shù),已然是業(yè)務鏈條中不可或缺的一環(huán)。
從這個角度看,此次發(fā)布的意義,或許并不只在于發(fā)布了四代架構圖,和四款邊端新品,而在于國產通用GPU,一邊抬頭,試圖超越行業(yè)標桿,并以更大的野心,嘗試面向無人區(qū)提出自己的路徑;一邊低頭,以一種更貼近現(xiàn)實的方式,不斷深入產業(yè)現(xiàn)場。
而這,可能才是天數(shù)智芯真正想證明的事情。