clsung is reading

提升推理效率的新突破:Multi-Head Latent Attention (MLA) 在 DeepSeek-V2 中的應用

DeepSeek-V2 採用 Multi-Head Latent Attention (MLA) 技術,大幅提升推理效率,減少記憶體使用,並加快推理速度。

GRPO 讀後心得

GRPO
GRPO

強化學習新突破!GRPO如何讓AI變聰明?

🚀 這篇是讀 DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models 的心得感想,有些地方就把論文裡引用的也放上去。


淺談 Deliberative Alignment

Deliberative Alignment
Deliberative Alignment

淺談 Deliberative Alignment

概念

「Deliberative Alignment」是一種讓人工智慧(AI)模型更安全的新方法。它不像傳統的訓練方式,只是讓 AI 看很多安全或不安全的例子來學習,而是直接讓 AI 讀懂人類寫的安全規範,並且學會在回答問題前仔細思考這些規範。這就像考試前要先讀熟課本一樣,AI 要先理解規則才能正確回答。


ChatGPT 推出 o3-mini 推論型模型

cover
ChatGPT o3-mini 上市啦

ChatGPT o3-mini 推論模型解析

📅 2025 年 1 月 31 日發布


DeepSeek 引發 AI 競賽新局面:人工智慧的史普尼克時刻

cover
DeepSeek 引發 AI 競賽新局面:人工智慧的史普尼克時刻


DeepSeek:AI 領域的重大突破與開源策略

cover
2025 新年快樂

DeepSeek:AI 領域的重大突破與開源策略 🚀

摘要

DeepSeek 透過其創新的大型語言模型(LLM)DeepSeek-V3 在 AI 跟國際領域帶來重大突破,特別是在效能與效率方面的卓越表現。本文探討 DeepSeek-V3 的技術架構、創新特點,以及其對 AI 產業的影響。


用 Docker Compose 部署 n8n

cover
n8n Docker Deployment

前言

n8n 是一個開源的 No Code / Low Code 的工作流自動化工具,可以讓你透過拖拉介面來建立工作流,並且可以透過 n8n 的 API 來與其他系統整合。


混合專家系統 (MoE):AI架構的策略性突破與技術實踐

cover
小年夜日落

摘要

本來想直接寫一篇 DeepSeek 的研究小心得(說 是因為愈看愈多愈發現似乎懂得愈少了…..),應該要先來分章說明一下核心技術再來寫心得,首先先來講一下什麼是混合專家模型 (Mixture of Experts, MoE)。


LLM Benchmarks:大語言模型的能與不能

cover
LLM 大亂鬥

摘要

大意: 本文是 LLM Benchmarks: Overview, Limits and Model Comparison 的讀後筆記,這是與目前輪調在我家的 MA (跟這篇同一位呦)讀完後的討論心得。大型語言模型(LLM)的評估是人工智慧發展的關鍵,本篇的基準測試 (Benchmarks) ,包括各種關鍵性能評估、各模型比較、並帶到了基準測試的局限性,以及如何評估 AI 應用的未來潛力。


轉移到 Hugo 後遇到的問題之一:解決分類頁面的顯示問題

AI 生圖

解決分類頁面的顯示問題

在決定將部落格從 WordPress 遷移到 Hugo 後,過程大致順利,但還是遇到了一些問題。今天想要分享其中一個較為棘手的問題:分類(Category)和標籤(Tags)頁面無法正確顯示文章列表的情況。