NVIDIA GTC 2025 主題演講
文章語言:
简
繁
EN
分享
紀要
原文
會議摘要
這段對話突出了英偉達在人工智能技術方面的顯著進步,強調了霍普和佈萊克維爾等架構的效率和性能,數據中心中能源效率的重要性,以及為解決網絡挑戰而推出的4位浮點精度和矽光子學創新。它還介紹了即將推出的架構、人工智能工廠和面向數據科學家和研究人員設計的新産品線。
會議速覽

令牌在早期檢測疾病、解碼生命的複雜性和理解生物功能方面發揮着至關重要的作用,有助于保護珍貴物種。

在GTC上,討論突出了人工智能和機器人技術對最大化潛能和增強人類能力的轉變影響,標志着技術探索新時代的開始。

英偉達突顯了人工智能方面的重大進步,展示了人工智能如何改變了計算機圖形和計算模型,導致了生成式計算和在各行各業中性能的提升。

最近在代理人人工智能和物理人工智能方面的突破性進展正在改變計算層。這些進步開辟了新的市場機會,並提升了各行各業的問題解決能力。

這段對話討論了人工智能發展面臨的三大基本挑戰:解決數據問題、在沒有人為幹預的情況下訓練模型,以及實現可擴展的算法。它強調了因為代理人工智能具有推理能力而導致的計算需求顯著增加,它可以逐步解決問題,這與以往的人工智能模型相比生成了更多的令牌。

對話突顯了人工智能模型計算需求的顯著增加,強調了強化學習和合成數據生成在教授人工智能推理方面的作用。討論了為訓練生成大量數據的挑戰,特別是在不過分依賴人類輸入的情況下,展示了強化學習在解決各領域複雜問題中的潛力。發言人強調了行業對這些挑戰的應對,表明了人工智能訓練方法的重大轉變。

對話突出了人工智能基礎設施的顯著增長,特別是在四大雲服務提供商(亞馬遜、Azure、GCP、Oci)中,指出了人工智能模型的需求和計算需求增加。它預測到本十年末將有數萬億美元的數據中心建設,這是由于從通用計算向人工智能加速計算的轉變和對軟件未來資本投資的認識所推動的。這種轉變的特點是人工智能工廠的興起,重點是生成計算用于各種應用。

對話突出了NVIDIA在各種加速庫的發展和影響,包括cuNumeric、cuLitho和cuOpt,在計算光刻,5G射頻處理和數學優化等領域顯著提升性能,旨在開源其中一些工具以進一步加快行業進步。

這一公告突顯出通過與主要系統公司合作,在加速計算方面取得了重大進展,引入了QDSS稀疏求解器和加速庫,用于結構化數據、物理模擬等領域,標志着行業向基于CUDA的解決方案轉變的一個轉折點。

演講者討論了人工智能的演變,強調其起源于雲端,源于基礎設施和計算需求。他們強調全棧技術的重要性,以及雲服務提供商在培育人工智能發展中的作用。演講者對人工智能進入企業、制造業、機器人和自動駕駛汽車等各個領域表達了興奮之情,並提到了GPU雲的出現。他們特別關注人工智能在無線網絡和邊緣計算中的轉變潛力,並宣佈與美國的主要公司合作,構建無線網絡的全棧,旨在通過人工智能和強化學習改變通信方式,調整無線信號。

NVIDIA已經深度參與自動駕駛汽車技術的發展超過十年,與特斯拉和通用汽車等主要公司合作。他們的技術,包括GPU和人工智能驅動系統,在數據中心和車輛中被用于培訓、模擬和道路操作。NVIDIA尤為自豪的是他們對汽車安全的承諾,為每行代碼開發了全面的安全評估流程,並獲得了與自動駕駛汽車安全相關的1000多項專利。他們采用先進的人工智能技術,如模型蒸餾、閉環訓練和合成數據生成,來增強自動駕駛車輛的適應性和安全性,確保它們能夠穩健地應對複雜情況。

英偉達通過Grace Blackwell MvLink 72機架,在計算機架構方面取得了空前的規模擴展,標志着從集成到非集成MvLink的根本轉變,以及從空冷到液冷系統的轉變,實現了單個機架中的1x flops超級計算機。

對話討論了AI推理的極端計算挑戰,強調了在生成AI響應的令牌時高效和高性能的需求。演講者解釋了令牌生成速度和數量的重要性,強調了AI系統中延遲和吞吐量之間所需的平衡,以確保最佳的服務質量、收入和盈利能力。

討論的焦點是如何優化人工智能服務,提供高質量的客戶體驗,同時最大程度地提高數據中心的效率和收入。它探討了在速度、計算能力、帶寬和人工智能模型複雜性之間的權衡,重點展示了一個演示,比較了傳統模型和推理模型在解決複雜問題上的表現。

對話討論通過在GPU之間分配工作負載,利用張量、流水線和專家並行性來優化具有數萬億參數的AI模型。它強調了像NVLink這樣的同質體系結構在處理複雜的計算階段,例如大型語言模型中的上下文處理和解碼,的重要性。

英偉達推出了Dynamo,這是一款設計用來在數據中心中管理複雜人工智能工作負載的開源操作系統,類似于組織人工智能工廠,為預填和解碼等任務提供動態資源分配。

討論探討了利用Hopper和Blackwell系統優化人工智能工廠的産量和能源效率。它強調了人工智能智能和大量生産之間的折衷,強調了在電力有限的數據中心中能源高效計算架構的重要性。介紹了MvLink 8和Dynamo等創新技術,以提高性能和效率。

這次討論強調了在人工智能操作中,Blackwell比Hopper有顯著的性能改進,強調了吞吐量和質量之間的平衡。Blackwell在ISO功率條件下一代比一代提高了25倍的性能,顯示了它在處理下一代工作負載方面的優勢,特別是在推理模型中,其性能比Hopper提高了40倍。

該討論強調了投資先進技術的優勢,特別是比較使用霍珀和佈萊克韋爾芯片的100兆瓦工廠效率,強調了生産能力和成本效益方面的顯著改進。

對話突出了建設尖端人工智能工廠的複雜性和規模,強調在實際建設之前使用數字孿生體進行規劃和優化。英偉達的Omniverse Blueprint使協同工程團隊能夠高效模擬和迭代設計,大大減少錯誤並加快建設過程。演講者還概述了未來人工智能基礎設施的路線圖,包括Blackwell Ultra和Vera Rubin系統,展示了這些大型項目所需的戰略規劃。

這段對話討論了NVIDIA的GPU進步,澄清每個Blackwell芯片包括兩個GPU芯片,並概述了未來計劃,包括旨在通過576個MvLink連接實現極端規模擴展的Ruben Ultra項目,以及性能和帶寬的顯著提升。它還強調了過渡到Spectrum X網絡技術,旨在通過類似Infiniband的性能增強以改進以太網網絡的管理能力,例如通過創建具有Spectrum X的最大單GPU集群。

該討論概述了數據中心中擴展GPU使用所涉及的挑戰和解決方案,特別關注使用收發器所帶來的能源和成本影響。它介紹了世界上第一台MRI微型鏡和矽光子學的發明,大幅降低了功耗,使處理大量GPU變得可能。這些進步為更高效、高容量的數據中心架構鋪平了道路,旨在節省數十兆瓦的電力,並促進數百萬個GPU的部署。

通過AI的企業計算的轉型涉及一個新的計算架構,包括處理器、操作系統和數據訪問方法的改變。 AI代理將成為數字化勞動力的重要組成部分,這將顯著改變企業的運營方式,需要開發一系列新的計算機。

一系列高性能計算機,包括DGX Station和Spark,針對數據科學家和研究人員宣佈推出,標志着人工智能計算的時代。這些系統具有20拍峰值每秒的計算能力,配備有72核心CPU、HBM內存和PCI Express插槽,將由惠普、戴爾、聯想和華碩等主要OEM廠商制造。該公司還在計算、網絡和存儲方面進行革新,推出一種可以在不同平台上運行的開源人工智能模型,包括新計算機和雲端。此外,突出全球公司之間的合作夥伴關系,整合人工智能框架。討論轉向機器人,強調由于全球勞動力短缺而需要自主機器人。英偉達的技術實現了機器人人工智能模擬、訓練、測試和實際經驗的連續循環,介紹了Isaac GRO N1,一種用于人形機器人的通用基礎模型,展示了融入人工智能和機器人技術的進展。

人工智能(AI)的核心挑戰包括數據創建、模型架構和擴展規律。為了解決這些問題,Omniverse作為物理AI的操作系統,通過Cosmos生成無限、穩定的環境。Newton是由DeepMind、迪士尼研究和英偉達(Nvidia)合作開發的,引入了專門為細致模擬設計的物理引擎,加速了機器人人工智能的訓練過程。

展示了先進的機器人技術和人工智能技術,包括實時模擬和機器人訓練方法後,演講人宣佈N 1團隊機器人平台現已開源,突出了人工智能和機器人技術的重要進展。活動還涵蓋了Blackwell的生産狀況,強調了對人工智能計算和雲端、企業和機器人基礎設施的不斷增長需求。
要點回答
Q:演講中強調了人工智能的能力是什麽?
A:人工智能現在可以幫助檢測疾病在發作前,理解生命的語言,保護貴族生物,發揮潛力,豐富收獲,教導機器人愉快地移動,伸出援手,並讓生活更加美好。
Q:GTC有什麽意義,它與Nvidia有什麽關系?
A:GTC 是與Nvidia有關的活動,它象征着不同行業聚集在一起討論人工智能的影響的聚會。GTC 也是一個平台,Nvidia在這裏強調其在人工智能以及在計算機圖形和計算中的發展。
Q:人工智能如何影響了英偉達的産品,比如GForce和GPU?
A:AI已經在Nvidia的産品中取得了重大進展,如GForce,通過將AI整合進來,實現了計算機圖形方面的革命。像50 90這樣的新一代GPU,因為AI的幫助,展示了在體積、能量散逸和性能方面的改進。
Q:提到的兩種人工智能是什麽,它們有什麽區別?
A:所提到的兩種AI類型是生成式AI和代理式AI。生成式AI是指教導AI在不同模態之間進行翻譯,如文字到圖像,而代理式AI指的是具有代理性質的AI,能感知背景,推理和規劃行動,使其適用于需要多模態信息和解決問題的任務。
Q:物理AI在機器人技術中的作用是什麽?
A:物理AI通過為AI系統提供對物理世界的理解,包括摩擦力、慣性、因果關系和物體持久性等概念,從而實現與機器人的結合。這種理解幫助機器人執行需要與周圍環境進行物理交互的任務。
Q:隨着具有代理功能的人工智能的到來,人工智能的計算需求發生了怎樣的變化?
A:隨着主動型人工智能的出現,它基本上是關于推理的,人工智能的計算需求大大增加。能夠逐步推理的人工智能,比如使用一系列思維鏈和最佳n輔助檢查的人工智能,會生成代表推理過程中步驟的令牌序列,從而與傳統人工智能模型相比需要更高的計算需求。
Q:根據演講,人工智能面臨的三個基本挑戰是什麽?
A:人工智能面臨的三大基本挑戰是解決數據問題(人工智能需要數據來學習)、解決無需人類幹預的訓練問題(人工智能應該能夠以超人類的速度學習,而且在規模上無法與人類匹敵)、以及擴展(人工智能需要隨着提供更多資源而變得更加智能,遵循一個擴展規律)。
Q:霍珀和佈萊克威爾發貨提到的重要性是什麽?
A:霍珀和佈萊克威爾的貨運標志着人工智能基礎設施的增長,以及支持具有推理能力的人工智能模型所需的增加的計算能力。數據表明,數據中心的資本支出顯著增加,表明對人工智能的需求正在推動對計算基礎設施的大量投資。
Q:當前計算機領域中正在發生的兩個動態是什麽?
A:這兩種動態是:1)從通用計算轉向在加速器和GPU上運行的機器學習軟件,這一轉變體現在數據中心建設上的變化。2)人們越來越意識到,未來的軟件需要大量的資本投入。
Q:說話者指的是計算機成為代幣的發生器是什麽意思?
A:演講者指的是傳統計算模式正在發生轉變,傳統計算模式是軟件被編寫和運行在計算機上,現如今有了新的模式,計算機生成必要的令牌來運行軟件,從而將計算機的角色從運行文件轉變為生成數據。
Q:演講者最喜歡的幻燈片是關于什麽的?
A:演講者最喜歡的幻燈片是關于各種圖書館對于加速計算至關重要,這也是GPU技術大會(GTC)的主要焦點。它強調了這些圖書館在實現人工智能和其他應用中的重要性。
Q:為什麽除了人工智能之外的領域需要像CUDA這樣的專業圖書館?
A:像Cuda這樣的專業圖書館在人工智能領域之外的領域中是必不可少的,因為它們為物理學、生物學和量子物理學等不同科學領域優化現有框架,從而加速這些行業中重要的進程。簡化的中文:像CUDA這樣的專業圖書館在人工智能領域之外的其他領域中是必不可少的,因為它們能夠為物理學、生物學和量子物理學等不同科學領域優化現有框架,加速這些行業中的關鍵進程。
Q:人工智能對通信和廣播網絡會有什麽影響?
A:AI將通過使用強化學習等技術來優化在不斷變化的環境和交通條件下無線電信號的使用,從而顯著提高無線網絡的效率和適應性。
Q:人工智能正在如何革新視頻處理和三維圖形?
A:人工智能正在通過應用在其他領域取得的類似進展來增強視頻處理和3D圖形,這可能包括在質量、效率和語境理解方面的改進。
Q:哪個行業最早采用人工智能技術,它是如何整合到行業中的?
A:人工智能應用最早的行業是自動駕駛車輛。Nvidia 在這方面發揮了重要作用,提供許多自動駕駛車公司使用的技術,無論是在數據中心中還是直接安裝在車輛中。
Q:誰選擇了英倫為他們未來的自動駕駛汽車車隊?
A:通用汽車(General Motors)選擇了英偉達與他們合作建造未來的自動駕駛汽車車隊。
Q:通用汽車的人工智能開發中安全的作用是什麽?
A:通用汽車的人工智能開發中,安全是至關重要的一部分,着重確保從矽片到系統的技術深入貫徹在開發過程的每個部分。通用汽車已經申請了超過1,000項與安全相關的專利,包括對每一行代碼的評估,以確保多樣性、透明度和可解釋性。
Q:Nvidia如何支持自動駕駛汽車(AVs)的發展?
A:Nvidia正在支持自動駕駛車輛的發展,利用其Omniverse和Nvidia Autopilot等技術,包括端到端可訓練的人工智能系統、模型精煉、閉環訓練和合成數據生成等功能。這有助于訓練人工智能系統,模擬駕駛場景,並生成駕駛知識,提高自動駕駛車輛的穩健性和適應性。
Q:Nvidia在數據中心和AI架構方面做了哪些創新?
A:Nvidia使用類似Grace Hopper的創新,對計算機架構進行了根本性的轉變,這是一台人工智能超級計算機。它具有高級的系統架構,其中一個Blackwell包中最多可容納8個GPU,配備了一些功能,如Mv link 8,雙CPU和Infiniband。這些創新使得在擴大規模之前首先擴大規模成為可能,創造了更有效的數據中心,並實現了先進的人工智能功能。
Q:Nvidia計劃如何應對為AI系統生成令牌的挑戰?
A:Nvidia致力于解決為人工智能系統生成令牌的挑戰,通過創建一個高效的“工廠”,最大化每秒令牌的生産量和響應時間。這涉及平衡計算flops和帶寬與延遲要求,以優化人工智能系統的性能和響應能力。
Q:傳統語言模型(LLMs)在解決複雜問題方面有哪些局限性?
A:傳統的線性學習機器在解決複雜問題方面能力有限,因為它們可能會在基本知識的基礎上犯錯,比如根據特定的約束條件為婚宴桌上的客人安排座位。
Q:推理模型與傳統的LLMs在處理複雜問題時有何不同的方法?
A:一個推理模型通過參與推理、嘗試多種情景並評估自己的回答來解決複雜問題,而不同于傳統的LLMs可能僅提供一次性回應而不經過推理過程。
Q:為什麽在計算資源方面,對問題進行推理很重要?
A:解決問題時的推理是重要的,因為它需要更多的計算資源,比如複雜問題需要8000多個標記,而傳統LLM解決的簡單問題需要更少。
Q:大型語言模型在計算資源方面提出了哪些挑戰?
A:大型語言模型由于其龐大的參數數量,往往達到萬億級別,這需要大量的計算資源,例如每秒幾TB的帶寬和巨大的能耗。
Q:英偉達采取的方法是如何管理這些大型模型的計算需求的?
A:Nvidia通過使用張量並行、流水線並行和專家並行等技術,將計算負載分佈到多個GPU上來處理,以優化高吞吐量或低延遲,並使用飛行批處理和其他技術來實現高效處理。
Q:Nvidia DynamO軟件在管理人工智能工廠中的重要性是什麽?
A:Nvidia的DynamO軟件在AI工廠中扮演着重要角色,它充當操作系統,管理複雜的操作,包括工作負載分配、數據處理和AI模型性能,以優化AI生産和效率。
Q:模擬可以提供關于人工智能工廠效率的哪些見解?
A:模擬顯示了AI工廠效率的洞察,展示了不同的配置和技術,比如使用Nvidia DynamO以及prefill和decode進程之間的平衡,如何影響AI系統的吞吐量和整體性能。
Q:數據中心中“帕累托前沿”這個術語指的是什麽?
A:“Pareto frontier” 指的是數據中心最優配置,代表着高效能使用的邊界,在不損害性能或電力消耗的情況下,進一步提高能效不再可能。
Q:這種展示的配置變化跨越光譜意味着計算機設置面臨着什麽問題?
A:跨領域展示的配置改變意味着計算機的設置可以根據工作量需求大大變化,數據中心的不同部分針對不同類型的工作負載進行了優化。
Q:佈萊克威爾在表現方面如何與霍珀相比?
A:Blackwell被顯示為Hopper性能的40倍,表明計算能力有顯著提升。
Q:根據演講者說,投資于Blackwell的優勢是什麽?
A:在佈萊克維爾公司投資的優勢在于它提供的性能和效率要遠遠超過霍普爾公司,這意味着由于技術進步速度快,工作負荷巨大,它是一項更有價值的投資。
Q:AI工廠是什麽概念?
A:AI工廠是一個專門為人工智能工作負載設計的大型數據中心,其中包括複雜的組件網絡,需要精密的規劃和工程技術。術語“數字孿生體”指的是在實際建造之前建立的這個數據中心的虛擬表示,以優化設計和集成。
Q:Nvidia未來産品的路線圖是什麽?
A:Nvidia未來産品的路線圖包括當前Blackwell的全面生産,今年下半年即將推出的Blackwell Ultra,明年推出的Vera Rubin産品性能是Grace的兩倍,以及隨後具備極大擴展能力的Ruben Ultra。
Q:新産品Vera Rubin與目前的産品相比如何?
A:Vera Rubin被定位為産品提供的下一個進化階段,性能比Grace高出一倍,帶寬更大,並且配備了50瓦的CPU。它還意味着與支持的GPU數量相關的命名方式的更新。
Q:在演講中,“Blackwell”一詞的意義是什麽?
A:“Blackwell”這個術語是指一系列專為支持人工智能工作負載而設計的先進芯片,其特點是在單個芯片上結合了多個GPU,最初在講話中被錯誤命名,但後來得到澄清。
Q:什麽技術實現了數據中心中GPU與交換機之間的連接?
A:數據中心中實現GPU和交換機之間連接的技術被稱為Moander,它利用收發器和激光將數據從GPU傳輸到交換機,然後再傳輸到其他交換機。
Q:在AI中擴大計算資源的主要挑戰是什麽,英偉達是如何解決這個問題的?
A:在AI的計算資源擴展方面,主要挑戰是需要消耗大量能量來供給額外的硬件。Nvidia正在通過開發創新技術,如矽光子學和MRI微鏡等方式來應對這一挑戰。這些技術與其他進步一起,使能更有效地利用能源,並在規模上部署AI系統,而不會産生過多的能源成本。
Q:MRI微型鏡的發明如何影響數據中心的能源消耗?
A:MRI(微共振鏡)微鏡的發明使用了波導、諧振環,並調節能量來關閉或傳遞光線,有助于在數據中心節省能源。它通過限制經過的光線(因此功率)的數量,從而減少大量GPU的發射器的能源消耗,節省了180兆瓦的能源消耗。
Q:矽光開關及相關技術的意義是什麽?
A:矽光子開關的重要性在于它實現了光子和電子集成電路的整合,以及微型透鏡和光纖陣列,利用TSMC的3D共封裝技術。這項技術能夠創造出高性能、節能的交換機,可在數據中心部署並支持擴展至數百萬個GPU。它有助于節能,促進了人工智能和企業計算基礎設施的發展。
Q:人工智能將如何改變企業計算和數字化工作者的未來?
A:AI將通過重新定義計算堆棧(包括處理器、操作系統、應用程序以及它們的組織和運行方式)從根本上改變企業計算的未來。它將導致數字化勞動力的崛起,AI代理將成為勞動力的一部分,預計將從10億增長到100億,成為軟件工程師的AI輔助工具。AI還將徹底改變整個計算堆棧,以支持企業計算的新需求。
Q:Nvidia的新一代AI計算機是什麽,誰會從中受益?
A:Nvidia的新一代AI電腦包括一系列個人電腦和工作站,比如DGX Station,它提供20 petaflops的計算能力,72個CPU核心和HBM內存。這些電腦造福于世界各地的數據科學家和研究人員,包括各種規模的企業,提供強大的工具推動AI的發展和研究。
Q:Nvidia 如何解決機器人和物理系統人工智能方面的挑戰呢?
A:Nvidia解決機器人和人工智能物理系統挑戰的方法包括創建一個名為Omniverse的系統,它作為物理人工智能的操作系統。它包括使用像Cosmos這樣的生成模型,可以為訓練機器人創建各種多樣化和可控的環境。此外,Nvidia與DeepMind、迪士尼研究和他們自己合作,創建了名為牛頓的物理引擎,它模擬真實世界的物理,以超現實時間速度訓練具有觸覺反饋和精細運動技能的機器人。
Q:Group N 1 的發佈對機器人和人工智能社區意味着什麽?
A:1組的發佈標志着人形機器人和人工智能領域的進步。它是人形機器人的通用AI基礎模型,受益于合成數據生成、學習和模擬。它允許開發人員在多個任務和環境中訓練機器人,這是實現機器人在各行各業集成和自主的重要一步。

英偉達公司
關註