【科技新聞】中國公司開發的DeepSeek 據稱媲美OpenAI和Meta人工智能推理模型

(MGN)

【KTSF 黃穎文報導】

中國公司聲稱用560萬美元,發展一個媲美OpenAI和Meta最新版本的人工智能推理模型DeepSeek,僅僅利用了2000塊較低配備的NVIDIA H800晶片。

在2023年創辦的中國創科公司「深度求索」(DeepSeek),幾週前發布了開源軟件DeepSeek-R1,而且根據該公司的研究文章,DeepSeek-R1在不同範疇,都比OpenAI的O1,和Meta的Llama AI優秀。

截至週一早上,DeepSeek的應用程式,在蘋果的App Store美國地區甚至位居第一,超越了ChatGPT的人氣。

對比ChatGPT,應用DeepSeek無需訂閱,相反ChatGPT的Pro計劃,用戶則需要每月支付200元。

DeepSeek除了對用戶更優惠,在發展階段也更便宜、快捷。

DeepSeek在發展共利用了560萬元,而且只用了約2000塊較低配備的NVIDIA H800晶片,便完成了訓練DeepSeek。

相反,Meta和OpenAI發展的金額高達1000萬至10億元,而且訓練類似規模的人工智能模型過程中,平均利用上萬塊晶片,有見這個資源利用的差距,有人工智能專家質疑DeepSeek利用電腦計算力的方式。

雖然如此,根據《華爾街日報》報導,有外界研究專家說,DeepSeek在儲存對話內容的語境,比其他人工智能遜色,而且DeepSeek沒有經過人類監督微調,意思是沒有預先輸入人類知識,所以DeepSeek依賴的是反複試驗的模式。

也有專家估計,DeepSeek的省錢省資源形式,有機會改變人工智能發展的方向。

有分析指,DeepSeek公司的規模是一百多人,但他們在各個領域都最有才幹的頂尖人才,各自負責最擅長的範疇,遇上困難就共同討論謀求解決,基本上行政、人事體系並沒有階級,而是基於共同的理念,按照研究人員自身的興趣而分工合作,公司就積極調動可用的資源,來讓他們盡量發揮。

本台嘗試利用DeepSeek的網上版,途中網站發出警告說,DeepSeek正受大型惡意襲擊,所以用戶未必能即日登記。

(Copyright 2025 KTSF. All Rights Reserved. This material may not be published, broadcast, rewritten, or redistributed. The Associated Press contributed to this report.)
版權所有,不得轉載。

您喜歡的新聞