CES 2025 | NVIDIA 宣布推出Nemotron模型系列，推動代理式AI發(fā)展

01/09 15:52 作者：NVIDIA英偉達

1481

加入交流群

掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作為 NVIDIA NIM 微服務(wù)，開放式 Llama Nemotron 大語言模型和 Cosmos Nemotron 視覺語言模型可在任何加速系統(tǒng)上為 AI 智能體提供強效助力。

人工智能正在進入一個全新的時代——代理式 AI。在這個時代，專業(yè)智能體團隊可以幫助人們解決復(fù)雜的問題并自動執(zhí)行重復(fù)任務(wù)。

借助定制 AI 智能體，各行各業(yè)的企業(yè)可以構(gòu)建智能解決方案，從而獲得前所未有的生產(chǎn)力。這些先進的 AI 智能體需要一個多樣化生成式 AI 模型系統(tǒng)，并且這些模型要針對代理式 AI 功能和能力進行優(yōu)化。這樣的復(fù)雜程度意味著企業(yè)對強大、高效的企業(yè)級模型產(chǎn)生了極大的需求。

為了給企業(yè)代理式 AI 奠定基礎(chǔ)，NVIDIA 宣布推出開放式大語言模型 (LLM) 的 Llama Nemotron 系列。該模型基于 Llama 構(gòu)建，可以幫助開發(fā)者在一系列應(yīng)用中創(chuàng)建和部署 AI 智能體，包括客戶支持、欺詐檢測、產(chǎn)品供應(yīng)鏈和庫存管理優(yōu)化。

許多 AI 智能體不僅需要語言技能，還需要感知世界并采取適當(dāng)行動的能力，以更有效地發(fā)揮其作用。

借助全新的 NVIDIA Cosmos Nemotron 視覺語言模型 (VLM) 以及面向視頻搜索和摘要的 NVIDIA NIM 微服務(wù)，開發(fā)者可以構(gòu)建智能體，分析來自自主機器、醫(yī)院、商店和倉庫的圖像和視頻以及體育賽事、電影和新聞，并對其做出響應(yīng)。針對希望為機器人和自動駕駛汽車領(lǐng)域生成物理感知視頻的開發(fā)者，NVIDIA 還宣布推出 NVIDIA Cosmos 世界基礎(chǔ)模型。

開放式 Llama Nemotron 模型優(yōu)化了 AI 智能體的計算效率和精度

NVIDIA Llama Nemotron 模型基于 Llama 基礎(chǔ)模型而構(gòu)建，為 AI 智能體開發(fā)提供經(jīng)過優(yōu)化的基礎(chǔ)模組。Llama 基礎(chǔ)模型是最熱門的商用開源模型集合之一，下載次數(shù)超過 6.5 億次。這一成果建立在 NVIDIA 致力于開發(fā)前沿模型的基礎(chǔ)之上，例如 Llama 3.1 Nemotron 70B，現(xiàn)在可通過 NVIDIA API 目錄獲取。

Llama Nemotron 模型使用 NVIDIA 最新技術(shù)和高質(zhì)量數(shù)據(jù)集進行剪枝和訓(xùn)練，可增強代理式 AI 功能。它們在指令遵循、聊天、函數(shù)調(diào)用、編碼和數(shù)學(xué)方面表現(xiàn)出色，同時經(jīng)過尺寸優(yōu)化，可在廣泛的 NVIDIA 加速計算資源上運行。

Meta 副總裁兼 GenAI 負責(zé)人 Ahmad Al-Dahle 表示：“代理式 AI 是 AI 開發(fā)的下一個前沿，為了抓住這次機會，需要在 LLM 系統(tǒng)中進行全棧優(yōu)化，以提供高效、準(zhǔn)確的 AI 智能體。通過與 NVIDIA 的合作，以及我們對開放模型的共同承諾，基于 Llama 構(gòu)建的 NVIDIA Llama Nemotron 系列可以助力企業(yè)快速構(gòu)建自己的定制 AI 智能體?！?/p>

包括 SAP 和 ServiceNow 在內(nèi)的領(lǐng)先 AI 智能體平臺提供商，有望成為首批使用全新 Llama Nemotron 模型的企業(yè)。

SAP 首席人工智能官 Philipp Herzig 表示：“能夠跨多個業(yè)務(wù)線協(xié)作解決復(fù)雜任務(wù)的 AI 智能體將會超越當(dāng)今的生成式 AI 場景，將企業(yè)生產(chǎn)力提升到一個全新的水平。借助 SAP 的 Joule，數(shù)億企業(yè)用戶能夠與這些智能體進行交互，以前所未有的速度實現(xiàn)他們的目標(biāo)。NVIDIA 的全新開放式 Llama Nemotron 模型系列將推動多個專用 AI 智能體的開發(fā)，助力業(yè)務(wù)流程轉(zhuǎn)型?！?/p>

ServiceNow 平臺 AI 副總裁 Jeremy Barnes 表示：“AI 智能體使企業(yè)組織能夠事半功倍，為業(yè)務(wù)轉(zhuǎn)型樹立了新的標(biāo)準(zhǔn)。NVIDIA 開放式 Llama Nemotron 模型性能和精度的提升有助于構(gòu)建先進的 AI 智能體服務(wù)，以解決各行業(yè)中各種職能的復(fù)雜問題。”

NVIDIA Llama Nemotron 模型使用 NVIDIA NeMo 進行蒸餾、剪枝和對齊。使用這些技術(shù)可以將這些模型保持較小的規(guī)模，以便在各種計算平臺上運行，并在提供高精度的同時提高模型吞吐量。

Llama Nemotron 模型系列將以可下載模型和 NVIDIA NIM 微服務(wù)的形式提供，可輕松部署在云端、數(shù)據(jù)中心、PC 和工作站。它們可以為企業(yè)提供業(yè)界領(lǐng)先的性能，并且能夠可靠、安全且無縫地集成到其代理式 AI 應(yīng)用工作流中。

使用 NVIDIA NeMo 定制并接入業(yè)務(wù)知識

Llama Nemotron 和 Cosmos Nemotron 模型系列將提供 Nano、Super 和 Ultra 三種規(guī)模，為部署各種規(guī)模的 AI 智能體提供廣泛選擇。

Nano：成本效益最高的模型，針對實時應(yīng)用進行了優(yōu)化，延遲低，非常適合部署在 PC 和邊緣設(shè)備上。

Super：高精度模型，可在單個 GPU 上提供卓越的吞吐量。

Ultra：精度最高的模型，專為需要超高性能的數(shù)據(jù)中心級應(yīng)用而設(shè)計。

企業(yè)還可以使用 NVIDIA NeMo 微服務(wù)為其特定用例和領(lǐng)域定制模型，以簡化數(shù)據(jù)管護、加速模型定制和評估，還可以應(yīng)用護欄，以確保響應(yīng)正常。

借助 NVIDIA NeMo Retriever，開發(fā)者還可以集成檢索增強生成功能，將模型與企業(yè)數(shù)據(jù)連接起來。

使用面向代理式 AI 的 NVIDIA Blueprint，企業(yè)可以利用 NVIDIA 先進的 AI 工具和端到端開發(fā)專長，快速構(gòu)建自己的應(yīng)用。事實上，NVIDIA Cosmos Nemotron、NVIDIA Llama Nemotron 和 NeMo Retriever 將為今天發(fā)布的面向視頻搜索和摘要的全新 NVIDIA Blueprint 提供強效助力。

NeMo、NeMo Retriever 和 NVIDIA Blueprint 均可通過 NVIDIA AI Enterprise 軟件平臺使用。

可用性

Llama Nemotron 和 Cosmos Nemotron 模型將以托管應(yīng)用編程接口的形式提供，可通過 NVIDIA 官網(wǎng)和 Hugging Face 下載：https://www.nvidia.cn/ai/

NVIDIA 開發(fā)者計劃的成員均可免費訪問開發(fā)、測試和研究資源：https://forums.developer.nvidia.com/t/nvidia-nim-faq/300317

在生產(chǎn)中，企業(yè)可以使用 NVIDIA AI Enterprise 軟件平臺在加速數(shù)據(jù)中心和云計算基礎(chǔ)設(shè)施上運行 Llama Nemotron 和 Cosmos Nemotron NIM 微服務(wù)。

查閱相關(guān)軟件產(chǎn)品信息說明：https://www.nvidia.cn/about-nvidia/terms-of-service/

版權(quán)聲明：與非網(wǎng)經(jīng)原作者授權(quán)轉(zhuǎn)載，版權(quán)屬于原作者。文章觀點僅代表作者本人，不代表與非網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有侵權(quán)或者其他問題，請聯(lián)系本站作侵刪。侵權(quán)投訴

人工客服
（售后/吐槽/合作/交友）

專題：

CES 2025 現(xiàn)場直擊

英偉達

NVIDIA（中國大陸譯名：英偉達，港臺譯名：輝達），成立于1993年，是一家美國跨國科技公司，總部位于加利福尼亞州圣克拉拉市，由黃仁勛、克里斯·馬拉科夫斯基（Chris Malachowsky）和柯蒂斯·普里姆（Curtis Priem）共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計業(yè)務(wù)，隨著公司技術(shù)與業(yè)務(wù)發(fā)展，已成長為一家提供全棧計算的人工智能公司，致力于開發(fā)CPU、DPU、GPU和AI軟件，為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計算解決方案提供支持。

CES 2025 | NVIDIA 宣布推出Nemotron模型系列，推動代理式AI發(fā)展

相關(guān)推薦

CES 2025 | NVIDIA 宣布推出Nemotron模型系列，推動代理式AI發(fā)展