本文參考了 OpenAI GPT-4.5 System Card 以及 Reddit 上 GPT-4.5 CRUSHES Simple Bench 的討論。
Posted by aritayu on Saturday, March 1, 2025
為因應金管會發佈的《金融業應用人工智慧(AI)六大指引》,與金融同業共組『AI 技術研究小組』,共同研議香港、新加坡、歐盟等 AI 監管前沿國家的治理規範。目標為使準則能夠量化、評估及執行,進一步強化 AI 在金融產業的合規與應用價值。
Posted by aritayu on Friday, February 28, 2025
NSA & MLA
DeepSeek 這一年推出了很多技術,最近我在前幾篇文章有提到 NSA 和 MLA ,看得出來 DeepSeek 正在全方位地解決 AI 模型的效能瓶頸,從不同角度提升 AI 的工作效率。而這兩者 Attention 的技術,就像是同一個工程團隊設計了兩種不同的最佳化方案:一種讓汽車更省油(NSA),另一種讓行李箱能裝更多東西(MLA)。
Posted by clsung on Monday, February 24, 2025
DeepSeek 新論文:NSA
Posted by clsung on Sunday, February 23, 2025
Posted by clsung on Sunday, February 16, 2025
GRPO
🚀 這篇是讀 DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models 的心得感想,有些地方就把論文裡引用的也放上去。
Posted by clsung is reading on Monday, February 3, 2025
Deliberative Alignment
「Deliberative Alignment」是一種讓人工智慧(AI)模型更安全的新方法。它不像傳統的訓練方式,只是讓 AI 看很多安全或不安全的例子來學習,而是直接讓 AI 讀懂人類寫的安全規範,並且學會在回答問題前仔細思考這些規範。這就像考試前要先讀熟課本一樣,AI 要先理解規則才能正確回答。
Posted by clsung is reading on Sunday, February 2, 2025
ChatGPT o3-mini 上市啦
📅 2025 年 1 月 31 日發布
Posted by clsung on Saturday, February 1, 2025
DeepSeek 引發 AI 競賽新局面:人工智慧的史普尼克時刻
Posted by clsung on Friday, January 31, 2025
2025 新年快樂
DeepSeek 透過其創新的大型語言模型(LLM)DeepSeek-V3 在 AI 跟國際領域帶來重大突破,特別是在效能與效率方面的卓越表現。本文探討 DeepSeek-V3 的技術架構、創新特點,以及其對 AI 產業的影響。