AI备忘录

长风破浪会有时，直挂云帆济沧海

世界模型的分类-李飞飞

By 李飞飞世界模型的三种功能第一种世界模型是渲染器。渲染器的任务是把信息转成人眼能看的像素，唯一标准是视觉上够不够逼真。不管是输入一句话就能生成航拍镜头...

2026 年 07 月 05 日

Agentic AI 图例

2026 年 06 月 28 日

KVCaching：LLM 推理加速

原文：KV Caching in LLMs, Clearly Explained在使用 ChatGPT 或 Claude 时，多半注意过这样一个现象：第一...

2026 年 06 月 27 日

LLMs Work in 6 Steps

how LLMs work — in 6 steps:Tokenization — Your text ...

2026 年 05 月 30 日

KV 缓存-注意力的 QKV 中的 KV [转]

搞懂缓存机制，从Gemma4到Claude Code省80%Token大模型生成文本时，用的是 Transformer 注意力机制。核心公式：Attent...

2026 年 04 月 09 日

Google Gemma 4(unsloth版)

https://.ai/docs/models/gemma-4Google DeepMind 推出的 G...

2026 年 04 月 06 日

高质量数据集建设[转]

8月28日下午，在2025中国国际大数据产业博览会“高质量数据集主题交流活动”上，《高质量数据集建设指引》正式发布。中国信通院院长余晓晖围绕高质量数据集建...

2025 年 11 月 16 日

Context Engineering 拆解

Breaking Down Context EngineeringContext Engineering...

2025 年 11 月 16 日

CodeActAgent

Executable Code Actions Elicit Better LLM AgentsGithub: https://github.com/xi...

2025 年 11 月 14 日

Qwen-Image Annotation Prompt

Qwen-Image 中采用的标注提示词：

2025 年 11 月 06 日