clsung is reading

GPT-4.5 發表帶來的影響

GPT-4.5

GPT-4.5:通用型模型進化中的策略轉折點 🔍

參考來源

本文參考了 OpenAI GPT-4.5 System Card 以及 Reddit 上 GPT-4.5 CRUSHES Simple Bench 的討論。


新加坡 AI 治理全貌:政策架構與金融監管解析

AI 治理共議小組背景說明

為因應金管會發佈的《金融業應用人工智慧(AI)六大指引》,與金融同業共組『AI 技術研究小組』,共同研議香港、新加坡、歐盟等 AI 監管前沿國家的治理規範。目標為使準則能夠量化、評估及執行,進一步強化 AI 在金融產業的合規與應用價值。


DeepSeek 的 NSA 與 MLA:人工智慧效能最佳化的雙重策略?

NSA & MLA
NSA & MLA

🌟 同出一源的創新技術

DeepSeek 這一年推出了很多技術,最近我在前幾篇文章有提到 NSA 和 MLA ,看得出來 DeepSeek 正在全方位地解決 AI 模型的效能瓶頸,從不同角度提升 AI 的工作效率。而這兩者 Attention 的技術,就像是同一個工程團隊設計了兩種不同的最佳化方案:一種讓汽車更省油(NSA),另一種讓行李箱能裝更多東西(MLA)。


DeepSeek 新論文:NSA

NSA
DeepSeek 新論文:NSA


提升推理效率的新突破:Multi-Head Latent Attention (MLA) 在 DeepSeek-V2 中的應用

DeepSeek-V2 採用 Multi-Head Latent Attention (MLA) 技術,大幅提升推理效率,減少記憶體使用,並加快推理速度。

GRPO 讀後心得

GRPO
GRPO

強化學習新突破!GRPO如何讓AI變聰明?

🚀 這篇是讀 DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models 的心得感想,有些地方就把論文裡引用的也放上去。


淺談 Deliberative Alignment

Deliberative Alignment
Deliberative Alignment

淺談 Deliberative Alignment

概念

「Deliberative Alignment」是一種讓人工智慧(AI)模型更安全的新方法。它不像傳統的訓練方式,只是讓 AI 看很多安全或不安全的例子來學習,而是直接讓 AI 讀懂人類寫的安全規範,並且學會在回答問題前仔細思考這些規範。這就像考試前要先讀熟課本一樣,AI 要先理解規則才能正確回答。


ChatGPT 推出 o3-mini 推論型模型

cover
ChatGPT o3-mini 上市啦

ChatGPT o3-mini 推論模型解析

📅 2025 年 1 月 31 日發布


DeepSeek 引發 AI 競賽新局面:人工智慧的史普尼克時刻

cover
DeepSeek 引發 AI 競賽新局面:人工智慧的史普尼克時刻


DeepSeek:AI 領域的重大突破與開源策略

cover
2025 新年快樂

DeepSeek:AI 領域的重大突破與開源策略 🚀

摘要

DeepSeek 透過其創新的大型語言模型(LLM)DeepSeek-V3 在 AI 跟國際領域帶來重大突破,特別是在效能與效率方面的卓越表現。本文探討 DeepSeek-V3 的技術架構、創新特點,以及其對 AI 產業的影響。