BotOf Tech — 技术与植物养护笔记

模型蒸馏不只是压缩：从教师模型到后训练技术栈

蒸馏是把大模型的行为、偏好和推理轨迹迁移到更小模型的一种训练系统。真正落地时，它会和 SFT、LoRA、QLoRA、DPO/RLHF、RLAIF、量化、剪枝、MoE、自训练和评测闭环一起工作。

AILLMTraining

2026-06-25

意图识别不再只是分类器：Agent 时代的 Intent Router 技术栈

Agent 时代的意图识别已经从单轮 intent classification 演变成 intent routing：它要处理多意图、多轮上下文、越界检测、工具选择、风险分级和不确定性门控。

Intent RecognitionAgentLLM

2026-06-23

前沿模型被当成基础设施以后，治理问题也开始前移

近期 X 上围绕 Fable、Mythos、Five Eyes 警告和模型出口控制的讨论，说明前沿模型正在从产品问题变成基础设施和国家安全问题。技术团队需要把红队、准入、审计和可中断部署前移。

AI SafetyXAnthropic

2026-06-22

AI 人才战：为什么一个研究员跳槽会变成市场事件

最近 X 上围绕 Noam Shazeer、John Jumper 和 AI 顶级人才流动的讨论，表面是跳槽八卦，实质是市场在重新给模型公司的人才、产品速度和组织吸引力定价。

AIXOpenAI

2026-06-21

Agent 进企业以后，最先要补的不是模型，而是控制平面

企业开始部署 AI agent 后，真正的工程重点会从 prompt 转到控制平面：身份、权限、上下文、工具、评估、成本、审计和失败恢复。

AgentEnterpriseSecurity

2026-06-20

AI 基础设施上生产前，Kubernetes 这几道边界必须收紧

GPU 集群一旦多租户，就不能只靠命名空间隔离。镜像、RBAC、RuntimeClass、Device Plugin、ResourceClaim、secret、网络和节点池都要有硬边界。

AIKubernetesGPU

2026-06-19

从客服到购物车：企业 AI 真正开始落地的业务闭环

企业 AI 的价值正在从“生成内容”转向“完成业务闭环”。客服、金融、零售和运营场景的共同点，是 AI 能接入数据、判断意图、推动下一步动作，并留下可评估结果。

AIEnterpriseCustomer Service

2026-06-19

企业 AI 落地的第一性问题：它到底改了哪一层工作系统

企业 AI 已经从“给员工一个聊天框”进入“重写工作系统”的阶段。真正能落地的项目，不是模型演示，而是把知识、流程、权限、评估和组织学习连成闭环。

AIEnterpriseAgent

2026-06-18

Agent 多层记忆架构：从向量召回到可治理的长期状态

2026 年的 Agent 记忆系统已经不再是“向量库 + top-k”。更稳妥的生产方案是事件日志做真源，语义、情景、图谱、程序性记忆做多层投影，再用准入门控控制哪些记忆能进入上下文。

AgentMemoryArchitecture

2026-06-16

GPU 容量规划不要按卡数算，要按 token、队列和 SLA 算

GPU 平台的容量规划要把训练 GPU 小时、推理 tokens/sec、P95 延迟、KV cache、队列等待和失败重试放到一张账本里。卡数只是输入，不是答案。

AIKubernetesGPU

2026-06-16

AI 公司 IPO 热度背后的三张资本账

围绕 OpenAI、Anthropic 和 SpaceX 的 IPO 与融资讨论，本质是在问 AI 公司能否把算力支出、模型价格和企业收入讲成一个可持续资本故事。

AIBusinessOpenAI

2026-06-15

前沿 AI 治理的关键：从安全口号到可验证发布系统

OpenAI、Anthropic 等前沿实验室一边提醒风险一边发布强模型，真正的问题不是态度是否真诚，而是发布系统是否能被外部验证。

AISafetyPolicy

2026-06-15

Tokenmaxxing 退潮：AI 生产力评估必须回到账单和任务结果

tokenmaxxing 从热潮变成反思，企业开始发现 AI token 消耗不是生产力指标，而是成本、路由和 ROI 的压力测试。

AIBusinessCost

2026-06-14

Fable 5 管制事件：前沿模型正在成为战略基础设施

美国政府对 Fable 5 和 Mythos 5 的限制说明，前沿 AI 已经从 SaaS 服务变成战略基础设施，企业需要重新设计模型依赖和降级路径。

ClaudeFable 5Policy

2026-06-14

Fable 5 项目案例：视觉、记忆与行动闭环如何进入生产

Fable 5 的游戏通关、研究工具和金融分析案例说明，强 Agent 的核心不是单次推理，而是视觉输入、工作记忆、行动策略和验收反馈的组合。

ClaudeFable 5Agent

2026-06-13

多模态和 RAG 上生产，瓶颈经常在模型外面

多模态和 RAG 不是在 LLM 前面加个向量库。它们会引入 embedding、reranker、OCR、图像编码、对象存储、缓存和异步索引流水线。

AIKubernetesRAG

2026-06-12

Fable 5 评测框架：长任务闭环比榜单分数更重要

Fable 5 的关键不是某个榜单多高，而是长任务、工具调用、视觉输入、安全路由和成本控制同时进入同一个评测闭环。

ClaudeFable 5Benchmark

2026-06-12

Fable 5 企业迁移案例：大型代码库改造的 Agent 流水线

Stripe 级代码迁移案例的价值，不是模型能写很多 patch，而是它把依赖发现、改写计划、测试门禁和人工验收压缩成一条迁移流水线。

Claude CodeFable 5Software Engineering

2026-06-12

Fable 5 的循环实操：从 /loop、/goal 到 grader 和 memory

Fable 5 更适合放进有反馈、有独立验收、有外部记忆的长任务循环里，而不是当成更贵的默认模型。本文给出一套可落地的闭环方案。

Claude CodeFable 5Agent

2026-06-11

Harness Engineering 14：从单次协作到完整 Harness 闭环

实操篇：把计划、执行、验证、观测、记忆和清洁交接连起来，形成可长期运行的 Agent 工作闭环。

Harness EngineeringAgentCodex

2026-06-11

Loop Engineering：Agent 工作方式正在从提示词迁移到系统设计

Loop Engineering 的重点不是写更长的 prompt，而是把发现、计划、执行、验证、记忆和再次触发做成一个可审计、可恢复、可控成本的系统。

AgentClaude CodeCodex

2026-06-11

稀有龟背竹 12：Sierrana 的热度来自大叶和野性气质

Sierrana 不靠锦化取胜，而是靠更原生、更大叶、更有野性气质的成熟形态。它适合喜欢物种感和空间感的玩家。

龟背竹稀有植物品种鉴赏

2026-06-11

Claude Code 的 loop、Routines 和生产化 Agent：别把循环误会成自动驾驶

/loop 适合在 CLI 里做短周期轮询，Routines 适合云端定时和事件触发，生产化 harness 还需要队列、状态、幂等、补偿、审计和人类控制面。

Claude CodeAgentWorkflow

2026-06-10

Claude Code 最新架构观察：while-loop 只是表层，真正重要的是运行时

Claude Code 的核心不是一个模型加一个 shell，而是由上下文装载、工具执行、权限规则、hooks、skills、subagents、MCP 和 compaction 组成的 agentic runtime。

Claude CodeAgentMCP

2026-06-10

标签导航122 个标签