Loading...

DeepSeek懶人包|MLA架構強在哪?什麼是知識蒸餾?6大QA解密DeepSeek效應

重點1 :DeepSeek的核心優勢在於效率和優化,其作為量化對沖基金孵化的背景,使其具備了追求效率和優化的基因。

重點2 :DeepSeek的創新源自團隊和方法論,例如DeepSeek的多頭潛在注意力架構(MLA)等創新技術,讓推理價格大幅降低,進而促進AI產業的競爭。

重點3 :DeepSeek模型確實存在審查問題,這將限制其在人文領域的發展,並可能阻礙通用人工智慧的實現。

在台灣農曆新年期間,中國DeepSeek在AI領域引發廣泛關注,其以「高性價比」的成本,訓練出媲美甚至超越OpenAI先進模型的產品,使其在競爭激烈的市場中投下利空因素,更讓輝達股價在5天內一度下跌16%。

Meta首席AI科學家Yann LeCun表示,DeepSeek 的成功,並不應該被看作中國(AI)超越了美國,應看作開源模型正在超越專有模型。

微軟執行長納德拉(satya nadella)則表示:「DeepSeek新模型令人印象深刻,尤其是在如何高效開發開源模型並進行推理運算方面,它的運算效率非常出色,我們應當非常認真地看待中國技術的進展。」

掌握最新AI、半導體、數位趨勢!訂閱《數位時代》日報及社群活動訊息

請輸入 Email
OpenAI推o3-mini應戰DeepSeek
面對DeepSeek橫空出世,OpenAI於2月1日火速推出全新推理模型o3-mini應戰,並在ChatGPT首次向所有用戶免費提供推理模型。

OpenAI執行長奧特曼近來公開表示,將重新思考 OpenAI的開源策略, 「我個人認為我們在了歷史錯誤的一邊,必須找出不同的開源策略,但並不是 OpenAI的每個人都同意這種觀點,這也不是我們目前的首要任務。」

奧特曼還說,OpenAI將效仿DeepSeek的做法,「我們很快就會展示一個更有用、更詳細的版本,感謝R1讓我們有所更新!」

https://www.bnext.com.tw/article/82150/deepseek-how-come

 TikTok不賣就必須在美...

back