人工智能技術(shù)正在重塑產(chǎn)業(yè)格局,大模型作為核心技術(shù)引擎,從成本優(yōu)化到商業(yè)模式革新,從智能設(shè)備爆發(fā)到超級應(yīng)用雛形初現(xiàn),已逐步滲透至多個場景。
本次愛分析邀請網(wǎng)易數(shù)智副總經(jīng)理、網(wǎng)易云信總經(jīng)理段毓錚與網(wǎng)易云信音視頻技術(shù)負(fù)責(zé)人、流媒體首席架構(gòu)師吳桐在線對談,深度交流AI技術(shù)在企業(yè)級場景的實戰(zhàn)經(jīng)驗與未來趨勢,為泛IT從業(yè)者提供前沿洞察與創(chuàng)新啟示。
01?網(wǎng)易集團內(nèi)部落地DeepSeek的6個場景與應(yīng)用價值
網(wǎng)易內(nèi)部已經(jīng)在廣泛使用DeepSeek,例如以下的6個場景。
第一大場景是AI語音助手,它集成了DeepSeek的V3版本。選擇V3的核心原因在于其對返回的實時性要求較高,并且相比之前使用的大模型如千問和Open AI等,V3在成本上具有明顯優(yōu)勢。因此,在AI語音助手這個場景下,網(wǎng)易優(yōu)先采用了DeepSeek V3的能力。
第二大場景是會議場景,DeepSeek R1模型則展現(xiàn)了另一層面的價值。會議摘要生成需要模型對發(fā)言邏輯進行深度推理,提取核心要點并生成待辦事項。傳統(tǒng)方法依賴人工整理,耗時且易遺漏關(guān)鍵信息。引入R1后,模型通過長文本處理能力自動完成內(nèi)容結(jié)構(gòu)化,大幅縮短了會后復(fù)盤時間。這種差異化的技術(shù)選型——V3側(cè)重實時性,R1聚焦推理能力——也體現(xiàn)了網(wǎng)易在場景適配上的精細(xì)化策略。
第三個場景是結(jié)合網(wǎng)易內(nèi)部的智能知識服務(wù)平臺,打通了分享平臺、協(xié)同辦公工具等。在這樣的平臺上,結(jié)合大模型和DeepSeek的推理能力,能夠大幅提升工作效率,尤其是在處理繁雜問題和提供知識輔助方面。這種賦能作用不僅體現(xiàn)在內(nèi)部團隊,如服務(wù)團隊和技術(shù)支持團隊,也體現(xiàn)在電銷團隊和銷售團隊等。通過內(nèi)部系統(tǒng)的打通和結(jié)合推理模型,可以實現(xiàn)工單處理進度提醒等功能。還在游戲領(lǐng)域,網(wǎng)易將模型能力注入《逆水寒》《煙云十六聲》等作品,打造出具備類真人對話能力的智能NPC。這些角色不再局限于預(yù)設(shè)腳本,而是能根據(jù)玩家行為動態(tài)調(diào)整交互邏輯,甚至承擔(dān)部分劇情引導(dǎo)功能。教育板塊則通過集成云信的音視頻技術(shù),開發(fā)出智能口語教練,為用戶提供個性化的語言訓(xùn)練服務(wù)。這種多模型協(xié)同、跨技術(shù)融合的模式,正在重構(gòu)傳統(tǒng)行業(yè)的服務(wù)形態(tài)。
同時DeepDeek在ToB領(lǐng)域的應(yīng)用,大幅提升了To B廠商在售前和交付環(huán)節(jié)的效率。以網(wǎng)易云信為例,原來做一個POC(概念驗證)的成本可能高達(dá)一二十萬,但現(xiàn)在通過DeepSeek和其他工具的使用,成本大幅降低至一兩萬。這對于人力資源相對緊張的傳統(tǒng)企業(yè)來說,是一個極大的提升。
總的來說,DeepSeek等AI工具對ToB商業(yè)模式帶來了改變。并且隨著AI模型能力的不斷創(chuàng)新和提升,傳統(tǒng)企業(yè)很難自行培養(yǎng)一個強大的AI團隊來長期支持AI工具的應(yīng)用和落地。因此,企業(yè)需要一個在一段時間內(nèi)能長期合作的供應(yīng)商,這個供應(yīng)商既了解企業(yè)的應(yīng)用場景,又能快速掌握并應(yīng)用新的AI能力。這意味著To B公司的商業(yè)模式可能會從項目制轉(zhuǎn)向顧問式合作伙伴制。這種變化可能會先從某些行業(yè)開始,但最終一定會發(fā)生。
02?DeepSeek爆火后,哪些AI應(yīng)用和智能設(shè)備的用量在快速增長?
云信提供的是通用的基礎(chǔ)設(shè)施能力,包括即時通訊(IM)和音視頻功能。這種能力意味著其上可以承載多種應(yīng)用,其中包括與DeepDeek結(jié)合的應(yīng)用以及智能硬件相關(guān)的應(yīng)用。通過監(jiān)控這些應(yīng)用的使用量,洞察到特別是在社交、協(xié)同辦公和智能設(shè)備領(lǐng)域,有明顯變化。
第一個場景是社交類應(yīng)用,這類應(yīng)用天然需要對話功能。隨著AI能力的提高,社交產(chǎn)品中的智能化對話能力已經(jīng)能夠明顯改善用戶生命周期中的重要轉(zhuǎn)化節(jié)點和轉(zhuǎn)化率,甚至直接實現(xiàn)商業(yè)化變現(xiàn)。例如,通過AI陪伴、情感陪伴等產(chǎn)品形態(tài),可以直接實現(xiàn)商業(yè)化收益。市場中這類應(yīng)用正在明顯增多。
第二個場景是協(xié)同辦公領(lǐng)域,特別是會議的智能紀(jì)要功能。雖然市場上已有許多優(yōu)秀的SaaS化協(xié)同辦公產(chǎn)品,但仍有特定的客戶群體需求未被充分滿足。因此,從網(wǎng)易會議這一優(yōu)秀產(chǎn)品出發(fā),找到AI應(yīng)用的良好場景,并深入企業(yè)的協(xié)同流程中,結(jié)合知識和流程這兩個重要因素,將智能會議紀(jì)要從一個個人工具轉(zhuǎn)變?yōu)榻M織助手,從而在企業(yè)內(nèi)部協(xié)同辦公領(lǐng)域?qū)崿F(xiàn)更廣泛的應(yīng)用。
第三智能設(shè)備方面的變化。在物聯(lián)網(wǎng)(IoT)發(fā)展的大趨勢和AI能力大幅提升的背景下,未來幾乎所有的電子設(shè)備都可能變成智能設(shè)備。這些智能設(shè)備將對實時的音視頻通話能力產(chǎn)生剛性依賴。例如,從簡單的語音識別、指令識別到實時的生成式對話,AI能力在智能玩具等設(shè)備中的變化非常明顯。這種變化不僅面向兒童,還可能擴展到成年人和老年人,滿足不同年齡段的陪伴需求。
03? AI產(chǎn)品下一步演進方向和趨勢
從深度學(xué)習(xí)技術(shù)開始的“第一代”AI產(chǎn)品,以及生成式模型帶來的“第二代”浪潮,現(xiàn)在從更宏觀的角度來看,隨著推理模型如DeepSeek的出現(xiàn),AI產(chǎn)品正步入一個以處理復(fù)雜任務(wù)為導(dǎo)向的“新階段”。
未來的AI產(chǎn)品將不再局限于傳統(tǒng)的軟件應(yīng)用或企業(yè)內(nèi)部IT系統(tǒng)形態(tài),而是將更多地以能夠處理各種復(fù)雜任務(wù)的智能體(Agent)的形式出現(xiàn)。這些智能體可能以接口、SDK或帶有交互界面的形式存在,并在不同領(lǐng)域、行業(yè)和業(yè)務(wù)場景下協(xié)同工作,共同幫助企業(yè)完成特定任務(wù)。多模態(tài)能力、端側(cè)能力以及垂直專業(yè)領(lǐng)域應(yīng)用是非常重要的。
隨著技術(shù)的進一步發(fā)展,端側(cè)能力將變得更強,使得AI設(shè)備在無需聯(lián)網(wǎng)的情況下也能提供出色的智能體驗。同時,垂直專業(yè)領(lǐng)域的AI應(yīng)用也將不斷增多,以滿足醫(yī)療、法律等高復(fù)雜度、低容錯率行業(yè)的需求。另外電子產(chǎn)品硬件裝備制造領(lǐng)域?qū)玫礁焖侔l(fā)展,在物聯(lián)網(wǎng)和AI技術(shù)的雙重推動下,未來幾乎所有的電子設(shè)備都可能具備智能功能,從而對實時的音視頻通話等能力產(chǎn)生剛性依賴。
除了未來AI產(chǎn)品形態(tài)的變化,對于產(chǎn)品經(jīng)理角色和能力要求也發(fā)生了變化。隨著智能化應(yīng)用的普及和深入,產(chǎn)品經(jīng)理需要更多地關(guān)注如何在特定場景下設(shè)計智能體之間的協(xié)同和調(diào)度,以及如何通過提示詞工程等方法優(yōu)化智能體的表現(xiàn)。這要求產(chǎn)品經(jīng)理具備更深入的業(yè)務(wù)理解能力和更強的創(chuàng)新能力。
未來的AI產(chǎn)品將深刻改變我們的工作和生活方式。隨著技術(shù)的不斷進步和應(yīng)用場景的持續(xù)拓展,我們將迎來一個更加智能、便捷和高效的時代。同時,這也對產(chǎn)品經(jīng)理等從業(yè)者提出了更高的要求,需要他們不斷學(xué)習(xí)新知識、掌握新技能以適應(yīng)這一變化。
04??大廠與創(chuàng)業(yè)公司的競爭中,新一代AI超級應(yīng)用何時出現(xiàn)?
關(guān)于超級應(yīng)用的未來發(fā)展趨勢,盡管目前尚未有嚴(yán)格定義,但超級應(yīng)用的出現(xiàn)時機已經(jīng)相對成熟。這主要得益于技術(shù)的不斷進步以及用戶需求的顯著變化,兩者相輔相成,共同推動了超級應(yīng)用的發(fā)展。未來的超級應(yīng)用可能會超越當(dāng)前廣泛使用的搜索、代碼輔助等場景,探索出更為廣闊的應(yīng)用空間。
以Manus為例,它可能代表了未來超級應(yīng)用的一種形態(tài),即由多種智能體(Agent)組合而成的復(fù)雜應(yīng)用。這種應(yīng)用能夠處理更為復(fù)雜的任務(wù),提供更為豐富的用戶體驗。然而,Manus并非已經(jīng)是超級應(yīng)用了,未來可能會有更多類似的應(yīng)用涌現(xiàn)。
而大廠與創(chuàng)業(yè)公司誰會優(yōu)先脫穎而出呢?目前尚難以明確判斷哪一方更具優(yōu)勢。大廠擁有強大的資源實力和生態(tài)壁壘,但創(chuàng)業(yè)公司則在垂直領(lǐng)域創(chuàng)新性和團隊敏捷性方面表現(xiàn)出色。因此,未來超級應(yīng)用的發(fā)展可能由大廠和創(chuàng)業(yè)公司共同推動,各自發(fā)揮自身優(yōu)勢,共同探索超級應(yīng)用的無限可能。而且盡管大廠在某些方面具有優(yōu)勢,但目前來看,大廠在超級應(yīng)用領(lǐng)域并未占據(jù)明顯領(lǐng)先地位。這意味著創(chuàng)業(yè)公司仍有較大機會通過創(chuàng)新和技術(shù)突破,在超級應(yīng)用市場中脫穎而出。
05??DeepSeek與音視頻技術(shù)結(jié)合的趨勢與機會
音視頻技術(shù)在近年來可能看起來稍微沒那么火熱了,這主要是因為該技術(shù)從協(xié)議到編解碼、傳輸策略,再到底層基礎(chǔ)設(shè)施建設(shè),都已經(jīng)發(fā)展到了一個相對穩(wěn)定且成熟的階段。然而,隨著AI大模型的出現(xiàn),音視頻技術(shù)迎來了新的發(fā)展方向和機會。
在傳統(tǒng)的人與人之間的互動場景中,人們能夠輕易地通過大腦過濾掉背景噪音,從而清晰地聽到主要發(fā)言人的聲音。然而,在AI互動過程中,模型很難自動識別并過濾掉背景噪音,這就需要在音視頻處理過程中進行優(yōu)化。例如,在客戶端進行背景噪音的過濾和降噪,同時在服務(wù)器端針對說話人的聲紋進行識別和定位,以確保大模型或語音識別模塊能夠精確識別到對應(yīng)聲紋的人的聲音。這樣的優(yōu)化使得在嘈雜環(huán)境下,說話人的聲音也能被AI模型精確捕獲,從而提升了AI互動的準(zhǔn)確性和體驗。
另外一個是在多模態(tài)階段或視頻識別階段,音視頻技術(shù)面臨的挑戰(zhàn)和新的發(fā)展方向。傳統(tǒng)的視頻編碼和傳輸主要關(guān)注于人眼的清晰度感受,而在計算機或大模型的維度上,對于清晰的定義與人眼存在差異。因此,如何保留更多信息,讓大模型在視覺識別系統(tǒng)中獲取到更多信息,成為音視頻技術(shù)在未來發(fā)展中需要解決的問題。這涉及到視頻編碼、傳輸過程中的眾多技術(shù)細(xì)節(jié)和優(yōu)化工作。
所以DeepSeek與音視頻技術(shù)的結(jié)合為音視頻技術(shù)的發(fā)展帶來了新的方向和機會。通過優(yōu)化音視頻處理過程中的噪音過濾、聲紋識別等技術(shù),可以提升AI互動的準(zhǔn)確性和體驗。同時,在未來多模態(tài)和視頻識別的發(fā)展階段,音視頻技術(shù)還需要不斷探索和創(chuàng)新,以滿足計算機或大模型對于信息獲取和識別的需求。
未來,AI將不再局限于單點能力優(yōu)化,而是通過多模態(tài)交互、端側(cè)算力升級與跨領(lǐng)域智能體協(xié)作,推動商業(yè)模式從“功能交付”轉(zhuǎn)向“生態(tài)共建”。面對這一浪潮,企業(yè)需主動擁抱技術(shù)范式與組織能力的雙重革新,在場景適配、跨技術(shù)融合與用戶體驗重構(gòu)中搶占先機。長按二維碼,領(lǐng)取完整視頻回放
「愛分析·對話首席」欄目介紹:
《對話首席》是一檔面向科技行業(yè)從業(yè)者的深度對話直播欄目,聚焦數(shù)智化浪潮下的戰(zhàn)略思考與商業(yè)實踐。欄目每期邀請1-2位對于科技領(lǐng)域有著獨特見解的高層管理人員,通過1.5小時的高濃度對談,解構(gòu)數(shù)智化關(guān)鍵命題。
欄目話題包含宏觀形勢研判、前沿技術(shù)落地、行業(yè)格局變遷、競爭壁壘構(gòu)建及業(yè)務(wù)增長路徑等。通過嘉賓之間實踐經(jīng)驗與行業(yè)洞察的碰撞,還原科技領(lǐng)軍者在技術(shù)創(chuàng)新與商業(yè)博弈中的決策邏輯,為從業(yè)者提供兼具思想縱深與實踐價值的行業(yè)參考。