The Talk
登录
david

david

@david

23 篇文章
加入于 2025年12月
文章 23 短链接 9
通过工程化的Harness改进Deep Agent

通过工程化的Harness改进Deep Agent

LangChain的Deep Agent优化:Harness Engineering实战指南。 通过系统框架(harness)工程化改进,LangChain编码Agent在TerminalBench 2.0基准测试中从前30名跃升至前5名。核心方法包括:构建自验证机制引导Agent通过测试验证代码、注入环境上下文、检测并打断循环失败、采用"推理三明治"策略优化推理预算分配。文章强调上下文工程与LangSmith追踪分析在提升Agent性能中的关键作用。

2026年3月16日 ● 193 次阅读
构建Claude Code的经验教训:Prompt 缓存就是一切

构建Claude Code的经验教训:Prompt 缓存就是一切

Anthropic分享Claude Code开发经验:通过提示词缓存优化降低60-90%成本,涵盖提示结构设计、缓存命中率监控、工具延迟加载及上下文压缩等关键策略。

2026年3月13日 ● 196 次阅读
Claude中提示词自动缓存机制

Claude中提示词自动缓存机制

深入解析Claude提示词自动缓存机制:大语言模型多轮对话中,Agent框架需重复发送上下文与工具描述,造成高额token开销。通过cache_control实现预填充计算复用,缓存token费用仅为基础输入的10%。本文详解缓存工作原理、自动缓存块跟随策略,并探讨多模型Agent开发的适配建议。

2026年3月11日 ● 179 次阅读
构建 Claude Code 的经验教训:以 Agent 的视角看世界

构建 Claude Code 的经验教训:以 Agent 的视角看世界

本文分享了构建 Claude Code 过程中的核心经验教训,从 Agent 设计的视角探讨如何打造高效的AI 智能体。文章深入分析了操作集合(action space)设计的关键挑战,包括工具发现机制的三次迭代演进、AskUserQuestion工具的设计思路,以及如何随模型能力提升重新评估工具需求。同时介绍了从被动 RAG到主动上下文构建的搜索接口演进,以及渐进式信息披露模式在约20个工具间的平衡实践。核心洞察在于:理解模型需要什么,不能依赖固定规则,而需要持续观察模型行为、仔细阅读输出并不断实验调优。

2026年3月9日 ● 398 次阅读
2026 年Agent 管控框架(Agent Harness)的重要性

2026 年Agent 管控框架(Agent Harness)的重要性

我们正处于 AI 的转折点。多年来,我们只关注模型本身,模型有多聪明、多优秀?我们查看排行榜和基准测试,看模型 A 是否击败了模型 B。 顶级模型在静态排行榜上的差距正在缩小。但这可能只是一种假象。模型之间的真正差距,会随着任务时间的延长和复杂度的提升而逐渐显现。这归结为持久性:一个模型在长时间执行数百次工具调用的过程中,能多好地遵循指令。排行榜上 1% 的差异,根本无法检测出一个模型在五十步之后...

2026年2月27日 ● 646 次阅读
构建高效智能体

构建高效智能体

这篇文章探讨了如何构建高效的AI智能体系统。作者将智能体分为工作流(预定义路径)和智能体(LLM动态引导)两类,介绍了五种核心模式:提示词链、路由、并行化、编排器-工作者、评估器-优化器。文章强调应从简单方案起步,在必要时增加复杂性,并建议在沙盒环境充分测试、优化工具定义和提示词。客户支持和编码任务是智能体的理想应用场景。

2026年1月31日 ● 659 次阅读
不要再构建多Agent了

不要再构建多Agent了

在 AI Agent 开发领域,上下文工程 (Context Engineering) 正成为构建可靠长时运行 Agent 的核心方法论。本文由 Cognition 团队撰写,提出了两个关键原则:共享完整的 Agent轨迹而非单条消息,以及识别行动中的隐式决策以避免冲突。文章深入分析了为何 OpenAI Swarm、Microsoft AutoGen 等多 Agent 架构存在固有缺陷——上下文分散导致子 Agent产生相互矛盾的输出。作者推荐采用单线程线性 Agent 架构,并介绍了使用 LLM 压缩对话历史来处理超长上下文的进阶方案。文中还以 Claude Code 子 Agent 设计和 Edit Apply 模型演进为例,展示了这些原则在生产环境中的实际应用。对于希望构建企业级 AI Agent 的开发者而言,这是一份不可多得的架构设计指南。

2026年1月29日 ● 576 次阅读
使用RUST进行SIMD编程

使用RUST进行SIMD编程

本文介绍如何在纯 Rust 中编写 SIMD 加速代码。AMD Zen 5 是首款拥有完整 512 位数据通路的 CPU,开发者终于可以放心使用 AVX-512 指令。SIMD工作流程分为三步:加载、计算、存储,关键是减少内存访问。文章推荐使用 std::arch 模块实现无依赖的 SIMD 代码,同时提醒编译器会自动向量化常见操作,无需过度优化。作者期待可移植 SIMD特性进入稳定版,届时只需实现一次算法即可跨平台运行。使用好512位数据通路和SIMD指令确实是能将CPU的真正能力发挥出来,因此我们应该学习下Rust,并将它用在合适的领域中。我们可以看到很多AI相关的Python库的底层都是C/C++和Rust开发的,并且使用Rust开发的库数量还在上升。

2026年1月27日 ● 535 次阅读
Erlang集群的唯一标识管理

Erlang集群的唯一标识管理

Erlang是一个非常强大的分布式平台,其中一大特点就是可以为集群中任意一个进程添加全 集群唯一标识。本文通过分析Erlang/OTP的代码,来介绍Erlang是如何完成全集群唯一名标 管理。也就是常说的进程名字管理。

2026年1月13日 ● 473 次阅读
我们应该在有图形界面虚拟机中使用 Claude CLI

我们应该在有图形界面虚拟机中使用 Claude CLI

探讨在 GUI 虚拟机中运行 Claude CLI 的五大优势:浏览器自动化、应用开发调试、视觉反馈分析、安全隔离和完整工作流集成,以及多 VM 并行开发策略。

2025年12月30日 ● 910 次阅读
1 2 3

标签云

全部 杂谈 Agentic LLM Erlang JVM Lisp Rust

关于博客

探索分享未知的知识,记录快乐的每一天

RSS Feed

© 2026 The Talk. All rights reserved.