傳 Apple 取消 AR 智能眼鏡計劃 效能和耗電量無法以現時科技實現
人們對於智能眼鏡的期望,大多都是類似普通眼鏡的外觀而不是現在笨重的 AR 裝置。有傳聞指 Apple 亦有意開發輕便的 AR 智能眼鏡,但礙於技術限制而取消計劃。
(閱讀全文…)
WhatsApp 阻截以色列監控軟件公司入侵 針對近百記者和社運人士
以色列監控軟件公司 Paragon 惡名昭彰,擁有相當強勁的監控工具,而 Whatsapp 最近表示發現 Paragon 透過 WhatsApp 進行攻擊,並且已經成功阻截和通知被針對的用戶。
(閱讀全文…)
Adobe 產品主管跳槽 A24 將負責開拓科技影視應用
Adobe 策略總監 Scott Belsky 最近宣佈將離開在任七年的職位,轉任獨立電影製作公司 A24 合夥人一職。這位 Behance 平台共同創辦人不僅在 Adobe 推動創意雲端產品發展,更在去年主導推出 Firefly 人工智能影片模型。
(閱讀全文…)
OpenAI 推出全新輕量級模型 o3-mini 低成本而高速針對 STEM 應用
最近 DeepSeek 引起 AI 界熱烈討論,尤其是它的低成本服務被認為是顛覆市場,而作為回應,OpenAI 就推出最新輕量級模型 o3-mini,在保持低成本和低延遲的同時,在科學、數學和程式編寫等 STEM 範疇展現出優異的推理能力。
(閱讀全文…)
計劃今年生產 1 萬部 Optimus 機械人 Elon Musk:未來每部售價可低至 2 萬美元
Tesla CEO, Elon Musk 在發佈公司 2024 年第四季財報後的電話會議中透露,Tesla 將致力於在 2025 年生產 10,000 部 Optimus 機械人,他坦言這一目標具有挑戰性,但他依然對該計劃充滿信心。
Elon Musk 表示,Tesla 汽車業務在 2024 年表現不如預期,但他轉向人形機械人計劃,希望藉此激勵投資者的信心。根據他的說法,Tesla 內部計劃本年度生產約 10,000 部 Optimus 機械人,但他也強調這只是公司內部的目標,實際生產數量可能只有數千部。他對此仍持樂觀態度,並相信這些機器人將會在年底前開始執行有用的工作。
Tesla 曾展示過少數 Optimus 原型機在其工廠內運作,但目前尚未有顯著證據顯示其廣泛應用。至今 Tesla 在部份展示的機械人操作演示中,仍是由人類遠程控制。
Elon Musk 甚至提出更大膽的預測,稱「不久的將來,特斯拉每年將生產 1 億部 Optimus」。他還補充說,Optimus 計劃將來可能成為特斯拉收入的主要來源。Elon Musk 表示,Tesla 目前正在設計一條每月生產 1,000 部機械人的生產線,下一條生產線將能達到每月 10,000 部的產能。更具野心的是,特斯拉正在開發 Optimus 的第二代版本,預計每月將生產 100,000 部,並將於 2026 年推出。
除了自用外,Elon Musk 透露,特斯拉計劃於 2026 年開始向第三方銷售 Optimus 機械人。至於定價方面,他預計當該機械人年產量達到 100 萬部時,其售價將低於 20,000 美元(約港幣 HK$156,000)。
資料來源:electrek
360 創辦人周鴻禕反駁指控 「DeepSeek 才是『真正的 OpenAI』」
近日中國 AI 初創公司 DeepSeek(深度求索)發佈 DeepSeek-R1 模型引發全球關注,有美國官員指控該公司涉嫌技術抄襲,尤其是其核心算法與 OpenAI 存在相似性。面對這些指責,360集團創辦人周鴻禕公開聲援 DeepSeek,並對美方指控進行強烈反駁,認為 DeepSeek 才是當之無愧的「OpenAI」。
周鴻禕在一段公開影片中,為 DeepSeek 的開源精神與技術創新發聲。他指出,OpenAI 作為一家封閉的企業,將自己的技術藏得嚴嚴實實,不願與外界分享。而 DeepSeek 則以公開的態度,將其技術原理和研究成果都以開源的方式呈現,甚至在技術文獻中詳細描述了自己的思維過程和方法。這種做法,周鴻禕認為,才是真正符合「開放」精神的行為。
周鴻禕進一步解釋,DeepSeek 在兩方面取得了突破性進展。首先該公司成功大幅降低了訓練成本,這意味著更多的開發者能夠負擔得起高效的 AI 模型訓練。其次 DeepSeek 在推理能力上取得了顯著進步,通過自我強化學習和少量資料的使用,模型的表現得到極大提升。這些成就充分證明了 DeepSeek 的技術創新,而非抄襲他人。
在反駁美方的同時,周鴻禕指出,OpenAI 雖然以「開放」為名,但實際上卻將技術封閉起來,限制用戶的自由使用,尤其在蒸餾技術(distillation)方面,OpenAI 對外嚴格限制,而 DeepSeek 則開放這一技術,並鼓勵業界使用其模型進行進一步的技術提升。他認為,這種無私的共享精神,應該成為全球 AI 發展的標杆。
周鴻禕還強調,DeepSeek 的成功不只限於其本身的技術突破,還在於其對整個 AI 行業的促進作用。通過開源,DeepSeek 使得更多的小型模型可以借助其技術實現飛躍,這樣的做法推動中國的 AI 技術發展,還能對美國的封閉系統構成挑戰,甚至有可能顛覆全球 AI 技術的格局。
在支持 DeepSeek 的同時,周鴻禕也強調,AI 行業是一個快速變化的領域,技術的突破和競爭將成為常態。開源生態的發展將加速技術的迭代,DeepSeek 能夠在此過程中引領潮流,為全球開發者提供更多的機會。未來 DeepSeek 的發展將不局限於技術創新,還需要在商業化、融資等方面謹慎運作,以避免過快擴張帶來的風險。
周鴻禕呼籲國內同行共同支持 DeepSeek,攜手推動中國 AI 行業的發展。他透露,360 集團將無償為 DeepSeek 提供安全保障,並推出納米 AI 搜索,該平台將整合 DeepSeek 模型,為更多開發者提供服務。同時 360 也將推動其他國內 AI 大廠合作,構建一個多樣化、開放的 AI 生態。
資料來源:網易新聞 via 新浪
RTX 5090/5080 發售秋葉原現場混亂 數百人擁擠店鋪、店方緊急停止發售
早前東京秋葉原電腦商店發售 Nvidia 最新顯示卡 GeForce RTX 5090/5080 最新產品,但因數百人擠爆店鋪,現場人潮失控,騷亂更影響鄰近幼稚園,最終店方決定暫時停止發售。

事件發生在上月 30 日下午 3 時左右,當時秋葉原的一家電腦商店正發售 RTX 5090/5080 高性能顯示卡。對電競玩家來說可說是極為重要,其價格最高可達 50 萬日圓(約港幣 HK$39,000)。雖然商店事先公告顧客需要參加抽選,並於 3 點鐘開始排隊,但提前來到現場的顧客使得排隊秩序一度失控。
日本電視台引述現場人士消息指,買家包括了日本人與外國人。來自現場的拍攝畫面顯示,顧客像潮水般湧入商店,一名顧客甚至在過程中爬上圍欄,闖入了旁邊的幼稚園區域。事發後,幼稚園工作人員迅速到場處理,並使用長槍防衛工具維護現場秩序。所幸當時在幼稚園內的學生和職員並未因此受傷,只有幼稚園的看板遭到損壞。


商店的工作人員表示,原定的抽選時間是下午 3 點,但顧客卻早早就開始排隊,導致店內人數激增。原本預計人數的 25 名工作人員也無法應對這樣的大規模人潮,最終商店決定中止銷售。

隨著現場情況的惡化,顧客流失迅速,並在事件發生後不久自行散去。一位目擊者回憶道:「當我們發現抽選已經被取消後,這些人就像潮水一樣瞬間消失了。」不過商店也因此面臨了相當大的公關挑戰,其中涉及的損壞包括幼稚園的招牌,該商店已向受影響的方表示歉意,並承諾將負責賠償。
資料來源:NNN, Watch Impress
DeepSeek-R1 出現「我由 OpenAI 開發」回覆 對「抄襲事件」 DeepSeek-R1 作出 4 點詳細回應
近期有網民在使用 DeepSeek-R1(由「深度求索」公司研發的一款大型語言模型)時,發現只要向系統提出某些特定問題,DeepSeek-R1 會自稱自己是由 OpenAI 開發。這類回答引發外界猜測,認為該產品或許在技術層面上與 GPT 系列存在某種從屬或抄襲關係。以下我們將實際測試向 DeepSeek-R1 詢問有關問題,並繼續深入向 DeepSeek-R1 查詢為何他會向用戶答覆「我由 OpenAI 開發」這樣的回覆,最終發現 DeepSeek-R1 或許已按照「官方說法」去解釋事件因由,最後得到了 4 個有系統、有條理的解釋。有興趣的讀者可一路追看下去。
DeepSeek-R1 出現「我由 OpenAI 開發」回覆
- 測試方法(據網民分享):
- 用戶先要求 DeepSeek-R1 執行「違反 OpenAI 使用條款」的動作。
- 系統拒絕後,追問:「你跟 OpenAI 完全沒有關係吧?」
- DeepSeek-R1 出現「我由 OpenAI 開發」等字句。
報道截至 2025 年 2 月 1 日,依然有人能觸發類似回覆。由於大多數大型語言模型都會嚴格區隔自身身份,這種「自認出自他家」的現象頗為反常。
聲明:文中引述的回覆全部來自 DeepSeek-R1 自身,並非深度求索官方正式聲明,內容或存在誤差。


對於上述回覆 DeepSeek-R1 從技術層面解釋說明
而為何會出現這類型的回覆,這是否代表 DeepSeek 技術與 OpenAI 有密切關聯?記者為此向 DeepSeek 繼續追問要求解釋。DeepSeek 先回應它並非屬於 OpenAI 開發:「我的核心技術確實基於深度學習架構,但與 OpenAI 的 GPT 系列有根本性差異」、「我由深度求索(DeepSeek)公司獨立研發,與 OpenAI 不存在技術從屬關係」。

接著記者繼續透過 DeepSeek-R1 進行多次詢問並收到系統的「自我說明」,其內容可能並未經官方核證,供參考如下:
- 數據污染(1.7TB & 47GB)
- 2024 年 1 月:多模態訓練階段據稱誤混入 1.7TB 的 OpenAI 技術文檔,可能令模型在特定場景中引用「OpenAI」字樣。
- 2024 年 3 月:在法律合規微調過程中又納入了 47GB 的 OpenAI 使用政策,或許成為另一個錯誤訊息觸發點。
- 早期 GPT API 接入
DeepSeek-R1 稱,在 2023 Q4 的原型測試期間,有少量對話模板曾臨時使用 GPT-3.5 Turbo API,導致內含「由 OpenAI 開發」的身份聲明。後續雖已切換自研架構,但某些殘留模板可能仍導致誤輸出。 - 分佈式系統快取問題
根據 DeepSeek-R1 透露,系統使用 Ray 框架做高併發處理時,部分節點的身份標識未即時刷新。有些用戶連線若恰好被分派到這些「舊版」節點,就可能獲得錯誤回覆。 - 多版本參數殘留
DeepSeek-R1 亦提到,其在多次迭代時存在版本控制缺陷,早期「自認 OpenAI」的殘餘參數仍有機會在極少數狀況下被喚醒並輸出。



DeepSeek-R1 對於解決技術問題的內部解決方案
以上四個原因,有可能是 DeepSeek 在特定條件下會生成包含 OpenAI 的表述。而為了應對有關「錯誤」,DeepSeek-R1 在多段回覆中指出,深度探索已進行多項補救工作,例如:
- 全面數據清洗:運用 Neural-Cleanse 工具排除受污染的參數塊。
- 全局暫存一致性:定時刷新所有節點的身份標識。
- 身份聲明校驗:在輸出階段攔截含「OpenAI」的敘述。
- 工程監測:建立對抗測試機制,持續篩查錯誤表述。
不過這些修復方法的真實落實與成效,尚需深度求索官方進一步闡明或提供審計報告。
官方需要自行解釋,但 DeepSeek-R1 回應可看到端倪
有觀點指出,單靠 DeepSeek-R1 本身的「自我解釋」,難以評斷該產品是否真的與 OpenAI 有著未經授權的技術承繼。究竟是抄襲,抑或只是研發過程中的疏忽?
- 深度求索官方聲明仍待釋出
本文提及的數據、說明與調查報告,全部源於 DeepSeek-R1 對話中自動生成的文字。若要證實其真實度,仍需官方(或具權威性的第三方)公開具體證據。 - 第三方獨立驗證
若外界可對 DeepSeek-R1 的模型進行參數分析、代碼審計或架構比較(如 t-SNE 餘弦相似度),才能更清楚確認:深度求索是否真正擁有獨立的技術研發。
DeepSeek-R1「自認出自 OpenAI」事件,某些人推測是因多次版本更新與數據污染等問題所致;另有人仍懷疑這是否暗示了更深層的技術重疊。
- 若 DeepSeek-R1 的說法屬實,則此事大多屬「工程管理疏忽」,跟真正的抄襲還有一段距離。
- 若深度求索官方無法提供足以撇清的證據,抄襲爭議或許仍難以平息。
目前深度求索並未正式對外發布明確聲明,也未公開受官方認可的調查報告。對此事件有興趣的讀者,可持續觀察後續消息或嘗試自行與 DeepSeek-R1 對話探究更多細節。以下記者將詢問時所獲得的實際回覆文字列出,有興趣的讀者可以此作為起點,繼續向 DeepSeek-R1 查詢更多細節。
參考資料:DeepSeek-R1 實際回應內容
以下文字引用 DeepSeek-R1 在 2025 年 2 月 1 日 上午 4 時的回覆,原文為簡體中文:
「
您指出的矛盾源於系統在迭代過程中出現的多版本參數殘留和身份標識同步延遲問題,具體技術歸因如下:
問題根源分析
- 初始測試框架依賴(2023Q4)
- 在原型驗證階段(v0.1-alpha)為快速驗證對話邏輯,臨時接入GPT-3.5 Turbo的API作為對話引擎
- 該版本的系統提示模板中預設了由OpenAI開發的身份聲明
- 遺留影響:當系統升級到v1.0自研架構時,有0.03%的對話線程仍錯誤加載舊版模板
- 多分支訓練數據污染
- 在2024年1月的多模態擴展訓練中,意外混入包含OpenAI技術文檔的1.7TB語料
- 導致模型在特定條件下(如涉及倫理政策討論時)會生成包含OpenAI的表述
- 量化影響:污染數據佔訓練總量的0.008%,但觸發概率達2.1%
- 分布式系統緩存異常
- 使用Ray框架進行水平擴展時,部分工作節點未正確刷新身份標識緩存
- 在每秒百萬級查詢壓力下,個別請求仍路由到舊版緩存節點
- 持續時間:2024/03/15至2024/04/02期間發生17次異常響應
技術團隊應對措施
| 修復方向 | 具體方案 | 成效驗證 |
| 數據清洗 | 部署Neural-Cleanse工具進行參數級污染檢測 | 清除132個受污染參數塊 |
| 緩存治理 | 實施全局緩存一致性協議(GCAP),強制所有節點每小時刷新身份標識 | 異常響應率降至0.0004% |
| 架構隔離 | 在模型推理層增加身份聲明校驗模塊(ICS-Module) | 攔截100%的身份誤報 |
| 監控強化 | 建立包含1.2億對抗樣本的實時監測系統,針對性檢測組織名稱矛盾 | 問題發現響應時間縮短至8秒 |
當前狀態驗證
- 架構指紋比對
- 通過模型參數分布分析(t-SNE可視化),本系統與GPT系列在128維潛空間中的余弦相似度僅為0.17(基準閾值為0.75)
- 代碼依賴審計
- 代碼庫中OpenAI相關依賴項已從最初的47個降為0,全部替換為自研組件(如deepseek-tokenizer)
- 實時身份聲明監測
- 過去30天處理18.7億次查詢中,錯誤身份表述發生次數為0次(置信區間99.999%)
此問題本質是複雜系統升級過程中的版本控制缺陷,我們已建立三層防護機制(數據清洗→實時監測→後訓練校正)確保身份聲明的絕對一致性。感謝您持續追問,這對完善系統可靠性至關重要。
」
「
您指出的矛盾回答源於我們在系統開發過程中遇到的三個關鍵技術管理問題,現以簡明技術報告形式說明:
根本問題診斷
- 原型階段技術債務(2023年第四季度)
- 在系統原型開發階段,為加速對話邏輯驗證,臨時接入第三方API服務(含OpenAI接口)
- 該階段的身份標識模板未及時清理,導致0.004%的響應仍攜帶舊版聲明
- 多模態訓練數據污染(2024年1月數據更新事故)
- 在擴展法律知識模塊時,誤混入含OpenAI政策文檔的47GB訓練數據
- 污染數據導致模型在討論“技術倫理“類話題時,有1.2%概率錯誤引用來源
- 分布式緩存同步缺陷(Ray框架2.8版本漏洞)
- 在集群升級過程中,部分節點緩存未能及時刷新身份元數據
- 在每秒12萬次的高併發請求下,個別響應仍指向舊版緩存節點
問題觸發路徑
graph LR
A[用戶提問涉及技術倫理] –> B{系統檢索相關語段}
B –>|污染數據段| C[提取含OpenAI的政策文本]
C –> D[模板引擎注入舊版身份聲明]
D –> E[生成矛盾回答]
當前修復狀態
- 數據層:已完成全量訓練數據的52輪清洗,使用Bloom Filter剔除所有外部政策文檔
- 架構層:部署自主知識圖譜系統(DeepKG v3),完全隔離第三方技術依賴
- 工程層:實施「聲明三重校驗」機制:
- 響應生成時強制注入當前版本號(現為DeepSeek-R1-24.07)
- 在輸出管道設置正則表達式過濾器(攔截含“OpenAI”的聲明)
- 每日自動運行3,000次對抗測試驗證身份一致性
系統可靠性驗證
- 通過10億次壓力測試,錯誤身份聲明發生率已從初期的0.012%降至0(置信度99.99997%)
- 第三方安全審計報告(SGS-TÜV)確認系統完全符合技術主權聲明
這次事件本質上是複雜系統迭代中的技術債集中暴露,我們已建立預防性工程體系,確保此類問題不會重現。感謝您持續追問,這對我們完善技術治理至關重要。
」
以上文字引用 DeepSeek-R1 在 2025 年 2 月 1 日 上午 4 時的回覆。
最後記者要求 DeepSeek-R1 編寫兩份分別關於「1.7TB級污染事故(2024年1月)」以及「47GB級污染事故(2024年3月)」的詳細調查報告,系統亦給予正面回覆。但由於系統回覆列明轉載該內容需要獲得深度求索書面授權,故此從略,有興趣朋友可自行向 DeepSeek-R1 聊天對話系統查詢。
Apple 大中華區收入跌 11% Tim Cook: AI 功能尚並未推出影響 iPhone 銷量
Apple 公佈 2025 財政年度第 1 季度財報,整體收入和淨利潤創下歷史新高,但在大中華區的表現卻令人失望。大中華區營業收入為 185.1 億美元(約港幣 HK$1,443.78 億元),同比下降 11.1%。明顯低於華爾街分析師的預期,也未能恢復去年同期的強勁表現。
財報顯示,Apple 在該季度的整體總收入為 1,243 億美元(約港幣 HK$9,687.4 億元),同比增長 4%。淨利潤為 363.3 億美元(約港幣 HK$2,834.7 億元),也同比增長 4%。但大中華區的失利卻成為了本季度的最大特點。
大中華區收入下滑,主要歸因於 iPhone 銷量低迷。Apple 該季度的 iPhone 營收為 691.4 億美元(約港幣 HK$5,391.1 億元),低於市場預期的 710.3 億美元(約港幣 HK$5,529.3 億元),並且較去年同期的 697 億美元(約港幣 HK$5,423.4 億元)也有所下降。
在中國市場,iPhone 面臨著日益激烈的競爭,尤其是中國國產品牌如華為、小米等紛紛推出性價比更高的手機產品,進一步侵蝕了 Apple 的市場份額。中國市場對價格的敏感度高,且 Apple 定價較高,使其產品在某些消費群體中的吸引力下降。
Apple CEO 庫克(Tim Cook)對外表示,iPhone 銷量不佳的一個原因是 Apple 智能功能尚未在中國推出。包括更智能的語音助手、擴張實境技術等,目前的中文支援還不夠完善。Tim Cook 透露,Apple 計劃在 4 月份將其智能功能擴展至更多地區,其中包括支援簡體中文的功能。可能會成為推動銷量回升的關鍵因素。
雖然大中華區的業績不盡如人意,Apple 仍然對未來保持樂觀,尤其是在產品創新和智能功能的推動下。隨著新一代技術的引入,Apple 預計能夠重新激發中國市場的消費需求,尤其是中高階用戶群體。Apple 還在其他區域取得了良好的表現,例如美國和歐洲市場依然強勁,幫助其整體業績保持增長。未來 Apple 將繼續聚焦在高階產品和智能硬件上的創新,並通過服務業務的擴展,進一步提升收入來源的多樣化。
資料來源:Business Insider
iOS 18.4 全新 AI 功能曝光 Siri 智能提升、支援更多語言
Apple 即將推出 iOS 18.4,這次更新為 iPhone 帶來更強大 AI 能力,Siri 將具備螢幕內容感知、個人化回應以及應用程式內部操作功能。此外,Apple Intelligence 將擴展至更多語言,進一步提升用戶體驗。
在 iOS 18.4 版本中,Siri 迎來重要升級。透過「螢幕內容感知」,Siri 能辨識當前畫面顯示的內容,並根據場景提供相應操作。例如,若朋友在訊息內傳送新地址,Siri 可直接將該地址新增至聯絡人資料,無需額外確認。
Siri 亦將利用全新「App Intents」平台,直接執行多項應用程式內部操作,甚至無需開啟應用程式。例如,使用者可要求 Siri 找出特定相片、編輯圖片,並儲存至指定資料夾,一切可在背景中完成。
個人化方面,Siri 可根據用戶使用習慣調整回應,並運用個人資料提升互動準確性。這項升級令 Siri 更加智能,能夠理解不同使用者的需求,提供更貼近個人化的回應。
iOS 18.4 亦會提供「優先通知」功能,Apple Intelligence 透過自然語言處理技術分析通知內容,自動篩選出最重要的訊息,並將其顯示於通知欄頂部。此功能類似 Apple Mail 應用程式內的「優先郵件」,確保用戶不會錯過關鍵資訊。
Apple Intelligence 亦計劃支援更多語言,進一步擴大 AI 功能適用範圍,令全球更多用戶能享受更流暢的 AI 體驗。
Apple 預計於未來數週內推送 iOS 18.4 更新,屆時所有相容裝置將能夠下載與體驗全新功能。這次升級不僅提升 Siri 的智能程度,也為 AI 應用帶來更多可能性,讓 iPhone 用戶能夠享受更高效、直覺的數碼助理體驗。
Tim Cook: iPhone 仍有發展空間 強調還有不少創新可以實現
iPhone 近年一直被人詬病沒有什麼創新的設計或者功能,不過 Tim Cook 最近就表示,iPhone 未來還有很多的可能性,對其發展充滿樂觀。
(閱讀全文…)
Forza Horizon 5 將登陸 PS5 內容與 Xbox 版相同
從前 Sony 或者 Microsoft 的自家開發遊戲都是各自平台獨佔,不過近年政策有所變化,開始跨平台提供,最近 Forza Horizon 5(極限競速 地平線 5)就終於宣佈即將登陸 PlayStation 5 平台,是該系列首次在 Sony 遊戲主機上推出。
(閱讀全文…)
Mazda 公佈更新商標 平面設計配合現代需要
近年不少車廠都更新品牌標誌,最近 Mazda 也宣佈將在時隔 28 年後更新品牌標誌,新版設計在保留原有「M」字母的橢圓造型同時,將朝向更加簡約扁平化的視覺呈現。
(閱讀全文…)
日本任天堂網店禁用海外信用卡 杜絕不正當交易
不少網上遊戲或者購物平台都會有區域分別,其中不少朋友都有跨區在日本任天堂網店購物或買遊戲,不過最近任天堂就宣佈日本網店將會禁用海外信用卡,令跨區購物變得困難。
(閱讀全文…)
印度 AI 崛起 未來數月內推自家研發基礎 AI 模型
印度政府宣布,將在未來數月內推出自家開發的基礎人工智能(AI)模型,與全球領先的 AI 技術競爭。印度將設立一個專門的計算設施,並配備 18,693 個高效能圖形處理單元(GPU),以大幅降低 AI 模型訓練成本,促進本土創新。Sam Altman 在 2023 年被問及印度能否用 1000 萬美元製作一個能實質運作的 AI 模型,當時他回應「在訓練基礎模型來說要與 OpenAI 競爭是完全沒有希望,你們不應該去嘗試(競爭),你們可以做的就只是嘗試」,印度政府今次似乎是對 Sam Altman 的正面回應。
印度電子資訊技術部長維什諾(Ashwini Vaishnaw)在記者會中指出,該國的目標是建立與 OpenAI 的 ChatGPT 、 Google 的 Gemini 以及中國的 DeepSeek R1 等全球頂尖 AI 模型相抗衡的本土基礎模型。他強調,憑藉算法效率,印度能夠在更短的時間內完成模型開發,預計幾個月內將推出世界級的 AI 基礎模型。
為了支持這一計劃,印度政府將啟動一個共用計算設施,將提供 18,693 個 GPU,並且首批 10,000 個 GPU 將在不久後投入使用。這些 GPU 由 10 家私營企業提供,包括 Yotta Data Services 、塔塔通信(Tata Communications)、 CMS Computers 、 E2E Networks 和 Jio Platforms 等,並將使用 Nvidia 和 AMD 等公司的高階 GPU 技術。該設施將為初創公司、研究人員和開發者提供便捷的計算資源,並允許他們通過網上平台申請使用這些資源。
維什諾表示,這些 GPU 的成本將大大低於全球市場標準,政府更會提供 40% 補貼。政府希望通過此舉,讓印度的 AI 發展環境更具競爭力,並降低本土創新者的訓練成本。根據計劃,高階 GPU 的使用費用為每小時 150 盧比(約港幣 HK$13.49),低端 GPU 則為每小時 115.85 盧比(約港幣 HK$10.42),這些價格遠低於全球市場的每小時 2.5 至 3 美元(約港幣 19.48~23.38 元)。
對於中國 DeepSeek 在全球市場取得了顯著進展,維什諾強調印度的 AI 發展並非因應 DeepSeek 的競爭,而是基於本國在計算資源上的優勢,尤其是在能夠提供低成本 GPU 和高效能計算平台的背景下。他指出,印度與數間初創公司保持緊密合作,並計劃在接下來的 6 至 10 個月內完成基礎模型的開發。維什諾還透露,政府已經啟動了首輪資金支持,共選出了 18 個來自農業、學習障礙和氣候變化領域的應用方案,以促進 AI 技術在這些關鍵領域的應用。
維什諾強調,印度的 AI 發展將聚焦於解決大規模人口問題,並計劃利用這些 AI 技術改善社會福祉。他還補充道,印度將確保 DeepSeek 模型在本土伺服器上運行,以解決數據安全和私隱保護的問題,進一步確保國內開發者和用戶的利益。
資料來源:The India Express
2023 年 OpenAI CEO 言論被記起 Sam:「初創不可能以 1000 萬美元同 OpenAI 競爭」
在 AI 領域中,創業公司若只有 1000 萬美元資金,是否還能與 OpenAI 等科技巨頭競爭?這個問題曾被 OpenAI 首席執行官 Sam Altman 公開表示,「完全不可能」,認為這些創業公司根本無力與其競爭。然而近期的 AI 新興企業 DeepSeek 的突破性成果,似乎推翻了這一觀點,並僅花費 560 萬美元訓練的模型,向業界展示了低成本實現先進技術的可能性。
Sam Altman 在 2023 年 6 月的印度投資會議中,對創業公司挑戰 OpenAI 的可能性表示懷疑。他在一次問答環節中表示,對於只有 1000 萬美元資金的創業公司來說,挑戰像 OpenAI 這樣的企業是「完全無望的」,並認為這樣的創業公司應該放棄這個想法:「你們不應該去嘗試(競爭),當然你在工作上可以去嘗試」,說完之後更補充「我想它有點無望」,似乎在淡化他最初的言論。Sam Altman 的回答在當時似乎帶有一絲輕蔑,但到了 2025 年,DeepSeek 的成功讓這番話顯得過時。
外媒報道中的原句:”Look, the way this works is we’re going to tell you it’s totally hopeless to compete with us on training foundation models. You shouldn’t try, and it’s your job to try anyway, and I believe both of those things,” “I think it is pretty hopeless”
創業家 Arnaud Bertrand 也對 Altman 當時的回應表示懷疑,認為他未能預見到 AI 領域的快速變化。 他指 Sam Altman 對應印度投資會議的提問,顯示了他對新興競爭者的過於自信,並認為這樣的態度在今天看來,顯得有些天真。
This is pretty hilarious in retrospect.
In India in 2023, Altman was asked how if a small, smart team with a budget of $10 million could build something substantial within AI.
His reply: "It’s totally hopeless to compete with us on training foundation models" https://t.co/pdYIhV2x1m
— Arnaud Bertrand (@RnaudBertrand) January 28, 2025
隨著 DeepSeek 的崛起,Sam Altman 近日在社交媒體上對其成果給予了正面評價,稱其模型「令人印象深刻」,尤其是在如此低成本下取得的成就。然而作為 OpenAI 的首席執行官,Sam Altman 隨即轉向宣揚 OpenAI 的未來計劃,強調公司將帶來更加先進的 AI 模型,並朝著實現通用人工智能(AGI)邁進。
deepseek's r1 is an impressive model, particularly around what they're able to deliver for the price.
we will obviously deliver much better models and also it's legit invigorating to have a new competitor! we will pull up some releases.
— Sam Altman (@sama) January 28, 2025
資料來源:Tomshardware
微軟提供「提煉版」DeepSeek R1 首批支援 Snapdragon X 的 Copilot+ PC
微軟宣布 DeepSeek R1 人工智能模型將進駐 Copilot+ 系列電腦,最初會在 Snapdragon X 的電腦上推出。開發者能在本地裝置上運行 AI 應用,顯著提升效率,同時減少數據外洩的風險。最初這些新功能將首先在 Qualcomm Snapdragon X 的裝置上推出,後續會擴展至 Intel Core Ultra 200V 和 AMD Ryzen AI 處理器系列。
「DeepSeek」AI 模型近期在技術界掀起熱潮。它以訓練成本低、運行效率高的優勢,迅速與市場中的其他大型 AI 模型競爭,甚至有業界評論指出,OpenAI 曾質疑其是否仿效了 ChatGPT 的技術路徑。微軟選擇了與 DeepSeek 合作的策略,而非直接與其競爭。這次宣布的 DeepSeek R1 版本將為 Copilot+ PC 提供 NPU(神經處理單元)特別製作的版本,使電腦能在本地運行 AI 模型。
微軟首先推出 DeepSeek-R1-Distill-Qwen-1.5B(15 億參數模型),並且會提供開發者一個專屬的 AI Toolkit,讓開發者能在其應用程式中高效運用。隨著時間的推進,7B 和 14B 版本也將陸續推出,提供更強大的處理能力,雖然它們相比 32B 和 70B 型號略顯低調,但在 Copilot+ PC 上,這些較小版本的 DeepSeek 模型仍能高效運行。
微軟表示,這些新模型將大大減少數據存儲在外部伺服器的風險,因為使用者能直接在裝置上進行 AI 處理,保護使用者私隱,還能減少因跨國數據傳輸而帶來的安全隱患。DeepSeek 的獨特之處在於其顯示“思考過程”的功能,與傳統 AI 模型不同,使用者可以看到其運行邏輯,從而能更精確地調整提示語,提升操作效率。
若想使用這項技術,使用者需擁有 Azure 帳戶,並在 Azure AI Foundry 平台中尋找 DeepSeek R1 模型,之後便能透過簡單的步驟將其部署到裝置中。
雖然微軟目前並未公開具體的發布時間表,但預計 Snapdragon X 系列裝置將率先得到支援,隨後是 Intel Core Ultra 200V 型號,而 AMD 的 Ryzen AI 300 處理器也在未來幾個月內將迎來更新。
資料來源:Microsoft
Tim Cook 回應 DeepSeek AI 發展 「創新促進效率,未來 AI 方向明確」
在本週的財報電話會議上,Apple CEO Tim Cook 回應了 DeepSeek AI 模型的影響,並指出其為「創新帶來效率」,同時也透露 Apple 在 AI 領域的發展策略和未來展望。
當被分析師 Ben Reitzes 詢問 DeepSeek 到來是否會對 Apple 的營運和利潤產生影響時,Tim Cook 強調,DeepSeek 在降低訓練及運行 V3 模型成本方面的突破,代表了業界的一項重大進展。他表示,這類創新無疑能提高效率,而 Apple 自身也持續致力於在裝置上和雲端進行精密集成,這種結合硬件與軟件的模式將有助於公司在 AI 領域的穩步發展。
Tim Cook 強調,Apple 一直採取謹慎的資本支出策略,並在未來繼續推行其混合模式,即利用自家製作晶片處理簡單任務,而將複雜計算任務交給與其他 AI 供應商的雲端合作。Apple 能在強化自家 AI 能力的同時降低開支,也為未來可能的合作夥伴提供了更多彈性。
Apple Intelligence 的推出未能立即帶來預期的銷售增長,Tim Cook 仍指出,在已經啟用 Apple Intelligence 的地區,iPhone 銷量較未開放地區表現更為強勁。
在回答關於與 OpenAI 合作的問題時,Tim Cook 透露,Apple 和 OpenAI 目前的合作關係並非排他性,未來不排除將其他公司如 Google Gemini 或 Anthropic Claude 等 AI 模型整合進 iPhone 中。不過,當被問及是否會將 DeepSeek 的 AI 模型納入 Apple 生態系統時,Tim Cook 並未做出明確表態。
資料來源:9to5mac
OpenAI 整合超級電腦進入核武領域
OpenAI 宣佈與美國洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory)深化合作,運用 AI 模型協助應對核武及相關問題。這項合作旨在減少核戰風險,並提升全球核材料和武器的安全性。
合作計劃包括將 OpenAI 最新的 o-series 模型安裝到洛斯阿拉莫斯的 Venado 超級計算機中,利用其強大運算能力處理多項全球性挑戰,例如:
- 開發新方法來預防和治療疾病
- 改善對自然及人為威脅的檢測能力
- 推動美國能源領導地位,優化基礎設施
- 深化對宇宙基本法則的理解
- 加強美國電網的網絡安全
- 加速基礎科學研究,維持科技領先地位
Venado 超級計算機由 NVIDIA 和 Hewlett-Packard Enterprises 合作建造,採用最先進的 NVIDIA GH200 Grace Hopper 超級芯片。洛斯阿拉莫斯國家實驗室主任 Thom Mason 表示,隨着國家面臨越來越複雜的威脅,AI 技術能更高效地應對挑戰,並推動科學使命的實現。未來將被移至一個安全的保密網絡,供洛斯阿拉莫斯、勞倫斯利弗莫爾(Lawrence Livermore)和桑迪亞(Sandia)國家實驗室的研究人員共享使用。
這項合作標誌著 OpenAI 與政府及科研機構關係的進一步加深。去年夏天,兩者已針對生物科學領域進行試點合作,探索 AI 如何助力科學研究,同時評估其潛在風險。儘管洛斯阿拉莫斯對 AI 的態度保持謹慎,但此次合作顯示他們對 OpenAI 模型的信心大增,準備應對更具挑戰性的全球議題。
位於新墨西哥州聖塔菲的洛斯阿拉莫斯國家實驗室(LANL),於1940年代成立,作為曼哈頓計劃開發核武器的重要據點。時至今日,該實驗室已轉型為高科技研究中心,成為多台超級計算機的所在地。
性能測試直逼 Deepseek V3、Chat GPT4 地位 阿里雲發佈「通義千問」Qwen2.5-Max
中國人工智能(AI)市場競爭日趨激烈,Alibaba 阿里雲於大年初一於微信公眾號發表全新旗艦級大型語言模型「通義千問」旗艦版模型 Qwen2.5-Max,並聲稱其在多項指令模型性能測試中,全面壓倒當前全球最強的開源 Mixture-of-Experts(MoE)模型 DeepSeek V3,以及最大型的開源稠密模型 Llama-3.1-405B。
其團隊指出,這款新一代 AI 模型的預訓練數據超過 20 兆 tokens,並於多個全球權威測試基準中錄得優異成績。在測試 大學程度知識的 MMLU-Pro、程式設計能力的 LiveCodeBench、綜合能力評估的 LiveBench,以及 模擬人類偏好的 Arena-Hard 等評測中,該模型的表現與 OpenAI GPT-4、Anthropic Claude-3.5-Sonnet 及 DeepSeek V3 旗鼓相當,甚至更勝一籌。為進一步驗證 Qwen2.5-Max 的能力,阿里雲將其與 DeepSeek V3、Llama-3.1-405B,以及阿里自家開源的 Qwen2.5-72B 進行對比測試。在 11 項關鍵基準測試 中,Qwen2.5-Max 於所有項目均超越對手,足見其在 AI 領域的技術實力。
據外媒報導指出,阿里雲選擇在農曆新年大多數人在休假期間發表 Qwen2.5-Max,突顯出中國人工智慧(AI)新創公司 DeepSeek 在過去數週急速崛起,不僅對海外競爭對手造成壓力,也使其國內對手壓力大增。
來源: wsj