DeepSeek R1 是第一個以 MIT 授權開放權重(open-weights)1,且推理能力可與 OpenAI o1 相媲美的模型。更棒的是,他們在論文中詳細記錄了訓練 過程,讓任何人都能了解其運作方式。
我們察覺到,DeepSeek 的開源是台灣幾十年來難得一遇,可以打造出一款能處理繁體中文,又具備推理能力的大型模型的機會——這正是我們打造台版「自由鋼普拉 FreedomGunpla R1」的機會。目前,我們已有懂得如何訓練模型的人才與 GPU,但仍缺乏資金與合法授權的繁體中文優質資料。
這個計劃只需要最後的臨門一腳。現在正是各大企業還沒完全布局的空窗期,如果各界企業或個人能在這個月拿出一筆錢來做 fine-tuning,我們就有機會搶先一步,合力打造一個能無礙處理繁體中文的大型語言模型。
這個黃金期過了,機會就不再了。
Code Name: 自由鋼普拉 FreedomGunpla R1 (暫定名稱)
技術重點:
- 以 DeepSeek R1 為基礎進行改造
- 重新訓練並以開源授權釋出模型權重
- 打造新的模型身份與品牌
目標里程碑:
- 第一階段:對齊西方價值觀,但是會變笨(高機率達成)
- 第二階段:讓變笨的模型變聰明(具可行性,但是機率低,需投入更多資源驗證)
- 終極目標:當用戶使用繁體中文或是英文時,模型表現比使用簡體中文更好
想了解更多,請參閱 「台灣製造」大型語言模型計劃
ℹ️ 大額贊助方式:若公司或個人願意捐款支持超過 100,000 元以上,亦可直接聯繫 OCF 開放文化基金會 <hi@ocf.tw> 索取銀行匯款資訊,透過轉帳匯款支持我們的行動。來信標題請包含:「台灣製造」大型語言模型計劃,並於內文說明欲贊助支持的級別或金額。