DeepSeek V3 在本地關注度遠落後於外國,這是讓我失望的,說它是 2024 最有驚喜的 AI 產品也不為過,可以看看 <這篇>文章。除技術外,小編也想知道為這間中國初創公司用了甚麼魔法施予在這產品上,這兩天看過幾篇訪問,現在跟大家分享一下他們公司管理哲學。
不看經驗只看能力 年青是團隊核心
DeepSeek 的用人策略非常特別,強調「能力重於經驗」。創辦人梁文鋒透露,公司團隊成員全為中國籍,主要來自頂尖高校應屆畢業生、博士後期實習生及少量畢業不久的專業人士。他直言:「中國未必擁有全球頂尖排名的學術人才,但我們有信心培養出這樣的人。」這種自信為 DeepSeek 人才體系打下堅實基礎。
而在管理層面 DeepSeek 同樣年輕化。以後期訓練團隊負責人吳俣為例,這位 2019 年從北航博士畢業的青年,已參與過小冰和必應百科等重量級項目。他與員工因年齡接近而溝通無間,決策過程高效直接,這樣的模式大幅縮短了執行時間。
此外,公司提供透明的評價機制和有競爭力的薪酬,並配以完善的培訓及導師制度,確保每位員工都能在個人發展上獲得支持。對員工而言,吸引他們的不僅是高薪,還包括深具意義的工作、自由的研究環境及廣闊的發展前景。
自由調動資源 激發內部創意
DeepSeek 的內部文化充滿彈性,任何員工都能靈活調用資源,根據興趣展開新項目。只要某個構想展現潛力,公司便迅速投入資源全力支持。例如公司關鍵技術 MLA(Multi-head Latent Attention)的誕生,正是源於一個團隊對主流注意力模型發展趨勢的深刻總結,並在實驗中逐步打磨出來。
梁文鋒曾分享:「靈感可能是一瞬間冒出的,但真正落地需要數月的反覆實驗。」這種從靈感到實現的快速迭代,讓 DeepSeek 能持續在技術創新中保持優勢,成為全球競爭者中的佼佼者。
相關文章:
中國 AI 公司新發表 DeepSeek V3 :一文看清 2 大技術及 6 個原因讓 AI 巨頭們感意外 中國 AI DeepSeek 號稱超越 OpenAI o1 具備推理能力、能輸出「AI 思考過程」
以挑戰更遠大的目標
除了年青人才及資源調配外,DeepSeek 的經營理念是「開發真正達到人類水平的人工智能」,他們並非模仿 ChatGPT 等現有 AI 模型為目標,而是探索通用人工智能(AGI)的奧秘。
DeepSeek 注重長期創新,對研究開發投入巨資,並希望通過開源方式推廣 AI 技術,促進行業發展。創辦人梁文鋒認為,「真正的價值在於團隊的成長與經驗的積累」,因此人才培育是DeepSeek競爭力的核心。
中國 AI 問題從不在資金而是硬件
梁文鋒在談及 DeepSeek 的使命時,明確指出中國 AI 產業真正問題並非資金短缺,而是硬件限制。「我們目前沒有短期融資計劃,資金從來不是瓶頸。真正限制我們是晶片禁運政策,這迫使我們必須在現有資源上最大化效率。」這種現實壓力,促使 DeepSeek 團隊在有限條件下發揮創造力,以技術和效率取勝。
與 OpenAI、Google 和 Meta 等國際巨頭相比,DeepSeek 無論在資金還是人才方面都處於劣勢。然而他們憑藉創新技術和靈活的商業模式,成功在有限資源下開發出高效能 AI 模型,並以相對低廉的價格吸引全球目光。
儘管如此,梁文鋒強調,低價策略並非他們的最終目標。「我們還在探索的階段,希望 AI 可以成為人人負擔得起的工具。」
梁文鋒認為「創新」在美國已是司空見慣的事, 但大部分中國企業給人印象是習慣 follow 而不是創新,DeepSeek 則以創新貢獻者的身份,主動參與全球 AI 競賽,因此才獲得關注。
預計只有一半中國 AI 公司能活下來
對於中國 AI 市場,梁文鋒直言:「目前還是燒錢階段。」他預測國內六家主要 AI 實驗室中,最終僅兩至三家能成功存活。那些定位清晰、運營能力強的公司將更有生存空間,而其他則可能面臨轉型甚至結束營運。
DeepSeek 的定位非常明確,他們不涉足直接面向企業(To-B)或消費者(To-C)的應用產品,而是專注於基礎模型和前沿技術研究,為其他企業構建應用生態提供強大支援。
總結:用人策略與技術突破是關鍵
DeepSeek 的快速崛起,無疑是年輕化人才戰略與技術突破的共同成果。從內部文化到資源調配,這間初創公司為中國 AI 企業建立了新標準。他們的模式或許能成為其他創業者的寶貴參考,甚至推動整個行業進一步發展。
來源 : 鉅亨
相關文章:
中國 AI 公司新發表 DeepSeek V3 :一文看清 2 大技術及 6 個原因讓 AI 巨頭們感意外 中國 AI DeepSeek 號稱超越 OpenAI o1 具備推理能力、能輸出「AI 思考過程」