理想汽車與阿里雲合作,打造智能座艙新體驗

如果座艙體驗是差異化的主戰場,那麼定義座艙體驗的模型自然是品牌的「靈魂」。
最近在思考,汽車確實是一個非常有趣的人造工業物種,它的發展貫穿了第二次工業革命到第四次工業革命的整個周期。一百年來,各種產業和產品興衰,汽車一直是那個最靚的仔,無論是對經濟的被動貢獻還是消費者的主動熱愛。
而且,並不是每個產業都能擁有一種文化,而汽車文化是一個相當主流的社會現象。它不僅僅關乎「交通工具」本身,而是一種生活方式與身份表達的集合體。
汽車的內涵在這個過程中不斷更新換代。從機械時代的馬力競賽,到電氣化時代的續航角逐,競爭焦點不斷轉移。曾幾何時,V8、V12這些數字就是實力的象徵,而特斯拉用一塊電池改寫規則後,續航里程又成為新的衡量標準。
AI大潮來臨後,新的法則正在形成,智能體驗成為新的戰場。這一次的革命更為徹底,畢竟一旦智能駕駛將人類從駕駛的舟車勞頓中逐漸解放,汽車也將史上第一次從一個出行工具變身為一個移動空間。
準確地說,一個擁有智能體驗的移動空間,誰能更好地理解這個空間裡的人,誰就能贏得未來。而在這場競爭中,一個有趣的現象正在浮現:那些深諳用戶思維、習慣數據驅動的團隊,似乎天然更懂得如何打造這個「懂人」的智能空間。
#### 一、產品基因的「代際傳承」
在雲棲大會期間,我與理想汽車空間AI團隊負責人江會星、阿里雲智能集團公共雲事業部AI汽車行業解決方案總經理霍健等進行了深入交流。兩家公司的合作,正是這種產品基因在AI時代「代際傳承」的縮影。
理想汽車創始人李想,就是中國最早也是最頂尖的產品經理之一,且聚焦於汽車這個垂直場景。這種原生的產品能力也深深植入了理想汽車。霍健在訪談中說:「理想等車企在產品智能化方面表現突出,創始人都有數字化產品的經驗。智能化的本質是模型和數據,這些都屬於用戶產品開發曾涉及的範疇。」
團隊天然習慣於快速迭代和數據驅動。江會星分享了理想內部的節奏:「我們每周都有AI周會,每周都有數據閉環的會議,每周都會從裡面看用戶反饋的問題,及時在下一版本迭代上去。」這聽起來完全不像一家汽車公司,而更像是一家產品驅動的科技公司。
基於這種產品哲學,理想做出了關鍵的戰略判斷。江會星說:「智能駕駛未來是剛需,真正有差異的就是這個移動『空間』(座艙)。」
當汽車的定義從「工具」躍遷為「空間」,一個核心問題浮現出來:這應該是一個什麼樣的空間?
理想汽車給出的答案非常清晰:家。對車內用戶來說,「家」意味著要在這個智能移動空間裡獲得一種「鬆弛感」。
一個房屋的舒適需要一個艱苦的裝修過程;一輛車的「鬆弛」同樣知易行難。霍健觀察到理想的作法:「體驗的背後,需要慢工出細活。每一個體驗都需要精心打磨,逐步優化完成。」
這就帶來了一個有趣的矛盾:既要像用戶產品那樣快速迭代,又要像工藝品那樣精心打磨。這看似是一個悖論,但恰恰是產品驅動理念的核心。快迭代確保了系統持續進化,慢工則保證了每一次交互的溫度。
我們可以用一個看似簡單的場景來剖析這種體驗的複雜度。車裡一位乘客說「我感覺有點冷」。
對於傳統汽車來說,只能是某名乘客執行一個簡單的全局(局部)調溫動作。
但在理想的智能空間裡,這句話啟動了一個複雜的認知過程。江會星詳細描述了理想自研的車端大模型MindGPT需要完成的工作:首先是環境感知和理解——誰在說話?坐在哪個位置?車內溫度、空氣質量如何?然後,MindGPT需要結合「全信息記憶」中對該用戶的了解,推理出真實意圖:是希望調節風向、開啟座椅加熱,還是調溫即可?
從被動的指令響應,到主動的意圖理解,這是AI帶來的核心價值。而這個看似簡單的「溫度」場景,實際上需要速度、深度、溫度的三重協同才能實現。
#### 二、速度、深度、溫度
在智能座艙時代,「速度」的定義正在被改寫。無論背後的計算多麼複雜,前端的交互必須快到讓用戶感覺自然流暢。
在今年雲棲大會上,阿里雲發布的通義Qwen3-Omni全模態模型展示了行業在這方面的最新進展。霍健提到,這個模型的端到端音頻對話延遲已經壓縮到211ms——這意味著從你開口到AI開始響應,整個過程快到大腦都察覺不到停頓。
這個速度背後,是通義團隊針對主流座艙芯片做的深度適配:通過精度優化讓計算更輕量、通過數據壓縮減少傳輸負擔、通過智能預判加快響應速度。這一整套技術組合下來,讓大模型在車內這個算力有限的環境裡,也能跑出接近雲端的性能。
這個數字低於人類的感知閾值(通常認為是300ms)。當延遲足夠低,用戶感覺不到等待,對話就變成了自然的交流。無論是理想的MindGPT,還是行業的其他領先模型,都在向這個目標逼近。前端體驗的「鬆弛感」,恰恰源於底層技術分秒必爭的「緊張感」。
但速度只是表象,真正決定體驗差異的是座艙模型的「深度」:它到底有多懂你。
要讓AI的這種「深度理解」真正落地,需要另一個關鍵能力:記憶。這就引出了端雲協同的架構選擇。
如果說端側是交互的第一線,聚焦於實時感知和快速響應,那麼雲端則承擔深度推理和長期記憶的重任。
霍健在接受訪談時具體介紹了雲端在「有點冷」案例中的角色:「雲端會首先進行記憶召回,找到『乘客』過去對溫度的偏好,提供給車端結合車外溫度、車內溫度、溫度偏好做執行。」他解釋了分工邏輯:端側負責實時感知(快),雲端負責深度推理和長期記憶(准)。
據悉,理想為此構建了認知科學中的三層記憶:程序記憶(習慣自動化)、情景記憶(特定事件記錄)、語義記憶(本質理解)。
當然,要構建這樣一個複雜的記憶系統,也對雲端基礎設施提出了極其苛刻的要求。它需要存儲海量的異構數據,並能在毫秒級完成複雜的檢索和推理。
據悉,理想同學的全信息記憶體系是基於阿里雲的Tair、Lindorm和圖數據庫(GDB)構建的。這套組合拳提供了完整的記憶機制:Tair負責實時上下文特徵和快速向量檢索;Lindorm承擔海量日誌和特徵的統一存儲;GDB則負責構建知識圖譜,讓AI能理解複雜關係,實現更類人的語義推理。數據顯示,這套系統實現了高達99.5%的召回準確率,同時平均查詢延遲僅為2ms。
因此,如果說「端」側決定了交互的「速度」,那麼「雲」側則決定了智能的「深度」,特別是「記憶」能力,讓理想同學像「家庭成員」一樣懂你。
回到最初那個「我感覺有點冷」的場景:MindGPT理解了用戶意圖,在2ms內調取了用戶的溫度偏好歷史,系統綜合判斷後精準執行了最符合用戶習慣的操作。速度保證了交互的自然,深度保證了理解的準確,而兩者的結合,才真正帶來了那種「家」的溫度。
這套端雲協同的打法,不僅定義了理想的产品體驗,也揭示了AI時代車企與雲廠商之間一種成熟、高效的協作範式。
#### 三、「靈魂」與「基座」
如果座艙體驗是差異化的主戰場,那麼定義座艙體驗的模型自然是品牌的「靈魂」。
2023年3月,ChatGPT發布沒多久,理想就快速立項了自研大模型MindGPT,並用9個月時間「把訓練大模型所有該趟的坑都趟了一遍」。
不過,完成從0到1是一個里程碑,速度又是另一個指標。
業內常說「AI一天,人間一年」,大模型的迭代周期越來越短,阿里通義大模型便是這一速度的極致體現。據統計,其近兩年已發布開源模型數量超過300。所以,垂直場景的模型如何跟上這個速度,借勢基模之力?
江會星強調,車端模型目前的核心在於掌握「後訓練(Post-training)」,特別是「強化學習(Reinforcement Learning)」的能力。他解釋,「強化學習中的獎勵函數(Reward Function)必須緊密貼合你當前真實的業務場景,比如CUA自主操作小程序交停車費場景中輸入的車牌號是否正確,再比如MindGPT回覆的內容是否滿足結構化要求等。」這意味著,你必須根據自己的品牌理念和用戶反饋,來告訴模型什麼是「好」,什麼是「壞」。只有掌握了這個「調教」模型的能力,AI才能真正進化為符合品牌調性的智能體(Agent)。
他用了一個更生動的比喻來解釋理想的策略:「可以這樣理解:我們已經建立了完整的大模型訓練流水線(pipeline),拿後訓練來說,一旦基座模型有了新迭代,都能夠快速接入這套流水線——從數據準備、指令微調、設計獎勵機制進行強化學習,再到模型效果評估,整套流程高度自動化且模塊化。」這意味著,新版本的模型都能以周為單位內完成升級、驗證與部署,無縫集成到「理想同學」智能體中,實現端到端的快速迭代上線。這種敏捷的閉環能力,不僅大幅縮短了從模型研發到產品落地的周期,也讓智能座艙的用戶體驗能夠持續、高頻地進化。
如果說強化學習的「獎勵函數」讓理想能夠定義什麼是「好」,那麼後訓練能力就是理想把這個「好」快速落地的武器。
因此,當理想掌握了「烘焙配方」,基座模型能力提升,會帶動整體性能提升;後訓練能力增強,同樣會讓基座模型發揮更大價值。這是一種能力的放大疊加,而非簡單的補充替代。
這套「靈魂」與「基座」的協作邏輯,也在定義一種緊密的產業合作關係。
理想具備原生的產品能力,知道用戶需要何種駕乘體驗;阿里雲提供AI原生的基礎設施,知道客戶需要怎樣的技術支撐。阿里雲曾經讓企業把應用「天然生長」在雲上,現在則讓智能成為產品與生俱來的能力。理想同學的「懂你」,本質上就是一種AI原生的產品體驗:AI不是後置的功能模塊,而是產品體驗的基礎設施。
智能座艙有了「靈魂」,產品能力遇上AI原生基礎設施,我們其實在見證一種移動智能體的進化。理想與阿里雲的合作,或許是為這個「新物種」的黃金時代,寫下了最關鍵的序章。(作者:高飛)