? 孫立彬
1月20日,中國人工智能企業(yè)深度求索(DeepSeek)發(fā)布推理大模型DeepSeek-R1;1月27日,DeepSeek應(yīng)用登頂蘋果中國地區(qū)和美國地區(qū)應(yīng)用商店APP下載排行榜,在美區(qū)下載榜超越了ChatGPT。大語言基座模型DeepSeek V3以及基于V3訓練、專為復雜推理任務(wù)設(shè)計的DeepSeek-R1模型,用較低的成本達到了接近于美國開放人工智能研究中心(OpenAI)開發(fā)的GPT-o1模型的性能。
引發(fā)AI行業(yè)三大巨變
DeepSeek大模型橫空出世,以卓越的性能、巨大的低成本優(yōu)勢以及全面開源在全世界迅速走紅。國內(nèi)外AI應(yīng)用訪問量及月活用戶數(shù)持續(xù)增長,DeepSeek Web端訪問量增長22倍,7天時間完成了1億用戶的增長。
賽迪顧問人工智能與大數(shù)據(jù)研究中心高級分析師白潤軒表示,DeepSeek為行業(yè)帶來了3個巨大變化,首先是成本革命。DeepSeek采用混合專家模型(MoE)架構(gòu)、動態(tài)路由算法和混合精度訓練等技術(shù),將大模型的訓練成本從數(shù)千萬美元降低至數(shù)百萬美元,推理成本降低99%,顯著降低了行業(yè)門檻。其次是性能突破。DeepSeek模型在多項基準測試中表現(xiàn)優(yōu)異,性能接近甚至超越GPT-4等頂尖閉源模型。例如,DeepSeek-R1在復雜推理任務(wù)中表現(xiàn)突出,被稱為“全能型AI助手”。第三是開源生態(tài)的崛起。DeepSeek開源了70%的核心模型和訓練框架,吸引全球開發(fā)者參與優(yōu)化和部署,推動了技術(shù)的快速迭代和普及。
在此之前,生成式AI領(lǐng)域奉行的是“大力出奇跡”及“各立山頭”的發(fā)展模式,誰占有最多的算力意味著可能研發(fā)出更強大的模型,更強大的閉源模型則帶來更高的收益。例如,ChatGPT Pro的訂閱費用高達每月200美元。
白潤軒表示,DeepSeek改變了這一切。通過低成本和高性能的結(jié)合,DeepSeek使大模型從“巨頭的玩具”變?yōu)椤按蟊姷墓ぞ摺保铀倭薃I在B端和C端的落地。DeepSeek還驗證了基于強化學習(RL)的新Scaling Law(尺度定律被業(yè)界認為是大模型預訓練第一性原理),強調(diào)算法創(chuàng)新而非單純堆砌算力,為行業(yè)提供了新的增長曲線。此外, DeepSeek模型推動了邊緣計算和端側(cè)AI的發(fā)展,未來算力需求將從集中式訓練向分布式推理擴展。
DeepSeek的出現(xiàn),為整個大模型行業(yè)帶來了技術(shù)普惠。在同等參數(shù)量下,DeepSeek實現(xiàn)推理速度提升30%以上、訓練成本降低40%,打破了“大模型=高成本”的行業(yè)魔咒,使得更多中小企業(yè)和研究機構(gòu)以更低成本部署大模型;同時其開源策略產(chǎn)生的“鯰魚效應(yīng)”倒逼閉源廠商加速技術(shù)迭代,推動大模型行業(yè)競爭從模型獨占性向數(shù)據(jù)飛輪和服務(wù)閉環(huán)演變,推動企業(yè)加快研究提供一體化解決方案。
IDC(互聯(lián)網(wǎng)數(shù)據(jù)中心)中國研究經(jīng)理程蔭表示,DeepSeek引領(lǐng)基礎(chǔ)大模型開啟另一開發(fā)新范式——以一系列降低成本/復雜性的創(chuàng)新優(yōu)化技術(shù)/手段,降低門檻,未來差異化競爭的結(jié)果是NLP大模型的進一步更新升級,軟件及硬件供應(yīng)商應(yīng)提供多模型選擇、高效且可靠的部署方式的大模型開發(fā)平臺或應(yīng)用開發(fā)工具,并進行軟硬件協(xié)同創(chuàng)新。2025年產(chǎn)業(yè)界也更加關(guān)注大模型和生成式AI的落地,整個生態(tài)系統(tǒng)應(yīng)通力合作加速應(yīng)用場景的創(chuàng)新及商業(yè)化。
加速AI應(yīng)用普及
“目前大模型已逐步融入工業(yè)研發(fā)、生產(chǎn)、運維、管理、服務(wù)等眾多應(yīng)用場景,在創(chuàng)新產(chǎn)品設(shè)計、提升研發(fā)效率、識別生產(chǎn)線故障、實現(xiàn)智能生產(chǎn)和安全預警等方面展現(xiàn)良好成效。當前DeepSeek的開源進一步增加了中小廠商獲取先進大模型技術(shù)的便利,加速其自身應(yīng)用開發(fā),加快適配更多應(yīng)用場景,推動未來工業(yè)領(lǐng)域的融合應(yīng)用更加廣泛,為產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型提供堅實支撐?!辟惖涎芯吭弘娮有畔⒀芯克芯渴腋敝魅瓮醮淞直硎?。
中信證券、銀河證券等券商的研報認為,DeepSeek新一代模型的發(fā)布,意味著AI大模型的應(yīng)用將逐步走向普及,加速AI應(yīng)用全面落地。
而中國的很多企業(yè)也確實正在積極擁抱DeepSeek。近期,包括云計算廠商、電信運營商、芯片廠商、軟件和眾多終端廠商、車企、券商密集宣布接入DeepSeek。
近日,DeepSeek-R1、V3、Coder等全系列大模型更是接入到國家超算互聯(lián)網(wǎng)平臺。
國家超算互聯(lián)網(wǎng)平臺相關(guān)負責人表示,先進的國產(chǎn)AI技術(shù)與國家級綜合算力服務(wù)平臺融合,是加速國產(chǎn)AI技術(shù)生態(tài)發(fā)展與普及的前沿實踐,將在市場、技術(shù)、創(chuàng)新、產(chǎn)品及用戶方面推動AI技術(shù)生態(tài)創(chuàng)新及成果落地,促進AI+的多樣化,推動中國乃至全球AI產(chǎn)業(yè)化進程和市場的拓展。
友情鏈接: 政府 高新園區(qū)合作媒體
Copyright 1999-2024 中國高新網(wǎng)chinahightech.comAll Rights Reserved.京ICP備14033264號-5
電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證060344號主辦單位:《中國高新技術(shù)產(chǎn)業(yè)導報》社有限責任公司