<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Harness Engineering |</title><link>https://www.ynlo.top/tags/harness-engineering/</link><atom:link href="https://www.ynlo.top/tags/harness-engineering/index.xml" rel="self" type="application/rss+xml"/><description>Harness Engineering</description><generator>HugoBlox Kit (https://hugoblox.com)</generator><language>en-us</language><lastBuildDate>Tue, 23 Jun 2026 00:00:00 +0000</lastBuildDate><image><url>https://www.ynlo.top/media/icon_hu_c9cf7bba6927cfbc.png</url><title>Harness Engineering</title><link>https://www.ynlo.top/tags/harness-engineering/</link></image><item><title>Harness Research 第一讲：定义及工具的配置</title><link>https://www.ynlo.top/blog/harness-research-lecture-1/</link><pubDate>Tue, 23 Jun 2026 00:00:00 +0000</pubDate><guid>https://www.ynlo.top/blog/harness-research-lecture-1/</guid><description>
&lt;div class="callout flex px-4 py-3 mb-6 rounded-md border-l-4 bg-gray-100 dark:bg-gray-800 border-gray-500"
data-callout="quote"
data-callout-metadata="">
&lt;span class="callout-icon pr-3 pt-1 text-gray-600 dark:text-gray-300">
&lt;svg height="24" xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24">&lt;path fill="none" stroke="currentColor" stroke-linecap="round" stroke-linejoin="round" stroke-width="1.5" d="M20.25 8.511c.884.284 1.5 1.128 1.5 2.097v4.286c0 1.136-.847 2.1-1.98 2.193c-.34.027-.68.052-1.02.072v3.091l-3-3a49.5 49.5 0 0 1-4.02-.163a2.115 2.115 0 0 1-.825-.242m9.345-8.334a2.126 2.126 0 0 0-.476-.095a48.64 48.64 0 0 0-8.048 0c-1.131.094-1.976 1.057-1.976 2.192v4.286c0 .837.46 1.58 1.155 1.951m9.345-8.334V6.637c0-1.621-1.152-3.026-2.76-3.235A48.455 48.455 0 0 0 11.25 3c-2.115 0-4.198.137-6.24.402c-1.608.209-2.76 1.614-2.76 3.235v6.226c0 1.621 1.152 3.026 2.76 3.235c.577.075 1.157.14 1.74.194V21l4.155-4.155"/>&lt;/svg>
&lt;/span>
&lt;div class="callout-content dark:text-neutral-300">
&lt;div class="callout-title font-semibold mb-1">Quote&lt;/div>
&lt;div class="callout-body">&lt;p>&lt;strong>Harness Research = Harness Engineering + Research Workflow&lt;/strong>&lt;/p>
&lt;p>以驾驭工程的方法论构建科研 Agent 的完整运行环境，让 LLM 在约束、工具和反馈回路的支撑下，可靠地完成科研全流程。&lt;/p>&lt;/div>
&lt;/div>
&lt;/div>
&lt;h2 id="1-课程介绍">1. 课程介绍&lt;/h2>
&lt;p>这个系列课程基于 &lt;strong>Harness Engineering&lt;/strong> 的理念去完成科研任务，取名为 &lt;strong>Harness Research (HR)&lt;/strong>。&lt;/p>
&lt;h3 id="核心定义">核心定义&lt;/h3>
&lt;p>&lt;strong>Harness Engineering（驾驭工程）&lt;/strong> 指的是除 AI 模型本身之外，支撑 Agent 完成生产任务的全部基础设施与工程体系。&lt;/p>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6">
&lt;p>&lt;strong>核心公式：Agent = LLM + Harness&lt;/strong>&lt;/p>
&lt;/blockquote>
&lt;p>其中 Harness 包括：&lt;/p>
&lt;ul>
&lt;li>系统提示词&lt;/li>
&lt;li>工具调用&lt;/li>
&lt;li>文件系统&lt;/li>
&lt;li>沙箱环境&lt;/li>
&lt;li>编排逻辑&lt;/li>
&lt;li>反馈回路&lt;/li>
&lt;li>约束机制&lt;/li>
&lt;/ul>
&lt;p>它不优化模型能力，而是通过环境设计、规则约束和执行机制让 AI 智能输出稳定、可预期。&lt;/p>
&lt;h3 id="类比理解">类比理解&lt;/h3>
&lt;p>&lt;strong>操作系统与 CPU&lt;/strong>：Harness 之于 Model，如同操作系统之于 CPU——无论 CPU 多强大，如果操作系统频繁崩溃，实际体验依然很差。&lt;/p>
&lt;p>&lt;strong>马与缰绳&lt;/strong>：Model 是马，Harness 是缰绳和马鞍，工程师是骑手——马有力量但没有方向，缰绳将力量引导为可控的行进。&lt;/p>
&lt;h3 id="关键洞察">关键洞察&lt;/h3>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6">
&lt;p>OpenAI 实验表明，使用相同模型、相同数据和相同提示，仅改变运行时环境（即 Harness），编程基准测试成功率可从 &lt;strong>42%&lt;/strong> 跃升至 &lt;strong>78%&lt;/strong>。&lt;/p>
&lt;/blockquote>
&lt;p>模型能力往往不是瓶颈，&lt;strong>Harness 的设计质量才是决定性因素&lt;/strong>。&lt;/p>
&lt;hr>
&lt;h2 id="2-为什么选择-trae">2. 为什么选择 Trae&lt;/h2>
&lt;p>当前主流的 AI 编程工具有几种形态：命令行（如 Claude Code）、IDE 集成（如 Cursor/Windsurf）、独立客户端（如 Codex）。&lt;/p>
&lt;h3 id="trae-的选择理由">Trae 的选择理由&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>对比维度&lt;/th>
&lt;th>Trae 的优势&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>&lt;strong>vs Claude Code&lt;/strong>&lt;/td>
&lt;td>有可视化面板，文件编辑、终端输出、MCP 调用结果都可以直接看到，对非程序员更友好&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>vs Codex&lt;/strong>&lt;/td>
&lt;td>可以更清晰地了解每个文件的状态，方便追踪科研产出&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>vs Cursor/Windsurf&lt;/strong>&lt;/td>
&lt;td>对中文用户更加友好，界面和交互更符合国内用户习惯&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>扩展机制&lt;/strong>&lt;/td>
&lt;td>同时支持 MCP 和 Skill 两种扩展机制，生态兼容性好&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>&lt;strong>简言之&lt;/strong>：Trae 在&amp;quot;功能完整&amp;quot;和&amp;quot;上手简单&amp;quot;之间找到了较好的平衡点，适合作为科研人员构建 Harness 的起点。&lt;/p>
&lt;hr>
&lt;h2 id="3-trae-的能力边界">3. Trae 的能力边界&lt;/h2>
&lt;p>Trae 提供了大脑 LLM 和执行环境，但它主要是用来进行编程的。它提供了基本的 txt、md 等文本文件读写，以及代码文件的读写、运行、debug 等环境。&lt;/p>
&lt;h3 id="核心逻辑">核心逻辑&lt;/h3>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6">
&lt;p>一切需要在屏幕前解决的工作（电脑解决的问题），都可以使用编程的方式进行处理。&lt;/p>
&lt;/blockquote>
&lt;p>因为编程可以操作电脑，而 Trae 等工具提供了 AI 进行编程的能力，所以 &lt;strong>AI 理论上可以完成电脑能够完成的任何问题&lt;/strong>。&lt;/p>
&lt;p>科研工作大部分是在电脑上完成的，故而 AI 可以帮助完成科研工作。&lt;/p>
&lt;h3 id="为什么需要-harness">为什么需要 Harness&lt;/h3>
&lt;p>虽然有了大脑和环境，但如果没有对 AI 的约束和指导，AI 就如同一匹脱缰的野马，输出是随机的、不稳定的，甚至南辕北辙。&lt;/p>
&lt;p>这就是为什么我们需要 &lt;strong>Harness&lt;/strong>——通过工具、约束和反馈回路来引导 AI 的行为。&lt;/p>
&lt;hr>
&lt;h2 id="4-trae-上下文的组成">4. Trae 上下文的组成&lt;/h2>
&lt;h3 id="一个关键前提ai-没有记忆">一个关键前提：AI 没有记忆&lt;/h3>
&lt;p>LLM 本身是&lt;strong>无状态的（stateless）&lt;/strong>——它不存储任何对话历史，每次请求都从零开始。&lt;/p>
&lt;p>你在 ChatGPT/Claude/Trae 中感受到的&amp;quot;记忆&amp;quot;，其实是应用层在每次发送新消息时，将之前所有对话历史（系统提示 + 历史消息 + 你的新问题）重新组装成一个完整的输入发给模型。&lt;/p>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6">
&lt;p>&lt;strong>类比&lt;/strong>：就像跟一个失忆的人说话，但你每次都先把之前的聊天记录念给他听——他不是记住了，而是刚读完。&lt;/p>
&lt;/blockquote>
&lt;h3 id="这意味着什么">这意味着什么&lt;/h3>
&lt;ul>
&lt;li>对话越长，每次发送的 token 越多，成本越高、速度越慢&lt;/li>
&lt;li>当对话超出上下文窗口限制时，最早的内容会被截断，AI 就&amp;quot;忘了&amp;quot;&lt;/li>
&lt;li>&lt;strong>上下文的质量直接决定了 AI 的输出质量&lt;/strong>——这就是为什么我们需要精心管理上下文&lt;/li>
&lt;/ul>
&lt;h3 id="上下文的组成">上下文的组成&lt;/h3>
&lt;p>上下文（Context）就是每次组装给 AI 的全部&amp;quot;背景资料&amp;quot;。Trae 通过 &lt;code>#&lt;/code> 符号在对话中引用上下文，分为两大类：&lt;/p>
&lt;h4 id="项目内上下文ide-内的信息">项目内上下文（IDE 内的信息）&lt;/h4>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>类型&lt;/th>
&lt;th>说明&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>当前编辑器文件&lt;/td>
&lt;td>AI 默认能看到当前打开的文件，无需手动添加&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>终端输出&lt;/td>
&lt;td>选中的终端输出可作为上下文（如报错信息）&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>#Code&lt;/td>
&lt;td>引用特定函数、类或代码片段&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>#File&lt;/td>
&lt;td>引用整个文件的内容&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>#Folder&lt;/td>
&lt;td>引用整个文件夹的内容（依赖代码索引）&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>#Workspace&lt;/td>
&lt;td>引用整个工作空间，AI 自动检索最相关内容（依赖代码索引）&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;h4 id="外部上下文ide-外的信息">外部上下文（IDE 外的信息）&lt;/h4>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>类型&lt;/th>
&lt;th>说明&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>#Doc&lt;/td>
&lt;td>上传个人文档集（支持 URL 抓取或本地 .md/.txt 文件），矢量化后本地存储&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>#Web&lt;/td>
&lt;td>联网搜索或指定网页读取内容&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;h4 id="辅助上下文">辅助上下文&lt;/h4>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>类型&lt;/th>
&lt;th>说明&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>#Problems&lt;/td>
&lt;td>引用&amp;quot;问题&amp;quot;面板的诊断信息&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>#Rule&lt;/td>
&lt;td>引用项目级规则（如 &lt;code>.trae/rules/&lt;/code> 下的文件）&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>#Past Chats&lt;/td>
&lt;td>引用历史对话内容&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6">
&lt;p>&lt;strong>科研场景中的典型用法&lt;/strong>：用 #Doc 上传领域知识文档，用 #Web 检索最新文献信息，用 #Folder 引用项目代码——这些组合让 AI 具备科研所需的领域背景。&lt;/p>
&lt;/blockquote>
&lt;hr>
&lt;h2 id="5-trae-功能的扩展">5. Trae 功能的扩展&lt;/h2>
&lt;p>我们需要给 LLM 配置可以进行科研工作的&amp;quot;眼睛&amp;quot;和&amp;quot;手&amp;quot;。目前最需要配置的就是科研相关的 &lt;strong>MCP&lt;/strong> 和 &lt;strong>Skill&lt;/strong>。&lt;/p>
&lt;h3 id="检索渠道">检索渠道&lt;/h3>
&lt;ul>
&lt;li>&lt;strong>技能检索网站&lt;/strong>：
（按 stars 排序，优先选择高星 + 近期更新的项目）&lt;/li>
&lt;li>&lt;strong>GitHub&lt;/strong>：搜索 &amp;ldquo;MCP server&amp;rdquo; 或 &amp;ldquo;claude skills&amp;rdquo; + 关键词，按 stars 排序&lt;/li>
&lt;/ul>
&lt;h3 id="推荐-mcp科研工具插件">推荐 MCP（科研工具插件）&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>名称&lt;/th>
&lt;th>Stars&lt;/th>
&lt;th>功能&lt;/th>
&lt;th>GitHub&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>&lt;strong>paper-search-mcp&lt;/strong>&lt;/td>
&lt;td>1.9k&lt;/td>
&lt;td>20+ 学术源检索（arXiv/PubMed/bioRxiv/Semantic Scholar），免费无需 API key&lt;/td>
&lt;td>
&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>zotero-mcp&lt;/strong>&lt;/td>
&lt;td>1.6k&lt;/td>
&lt;td>连接 Zotero 文献库，支持语义搜索、PDF 标注提取、引用分析&lt;/td>
&lt;td>
&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>scholar-sidekick&lt;/strong>&lt;/td>
&lt;td>-&lt;/td>
&lt;td>引用格式化（APA/IEEE 等 10000+ 样式）、文献验证（检测 AI 伪造引用）、撤稿检查&lt;/td>
&lt;td>
&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;h3 id="推荐-skill科研技能包">推荐 Skill（科研技能包）&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>名称&lt;/th>
&lt;th>Stars&lt;/th>
&lt;th>功能&lt;/th>
&lt;th>来源&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>&lt;strong>AcademicForge&lt;/strong>&lt;/td>
&lt;td>-&lt;/td>
&lt;td>学术写作技能整合包（类似 Minecraft Forge 模组加载器），集成 247+ 个科研 Skills：scientific-agent-skills（133 个，覆盖 15+ 学科）/ AI-research-SKILLs（82 个，AI 研究方向）/ paper-polish-workflow（论文翻译润色审稿）/ humanizer-zh（中文去 AI 味）/ scientific-visualization（出版级图表）。支持在线选配站按需安装，Trae 友好&lt;/td>
&lt;td>
&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>medical-research-skills&lt;/strong>&lt;/td>
&lt;td>-&lt;/td>
&lt;td>550+ 医学研究专用 Skills，覆盖四大领域：Evidence Insights（文献检索与证据图谱）/ Protocol Design（实验方案与统计设计）/ Data Analysis（R/Python 生信代码生成）/ Academic Writing（SCI 论文撰写与投稿）。专为生物医学研究设计，包含临床队列设计、生物标志物分析、Meta 分析等专业化流程&lt;/td>
&lt;td>
&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;hr>
&lt;h2 id="6-mcp--skills-的检索和配置">6. MCP + Skills 的检索和配置&lt;/h2>
&lt;p>详见实操环节。&lt;/p>
&lt;hr>
&lt;h2 id="教学目标">教学目标&lt;/h2>
&lt;p>完成本讲学习后，你应该能够：&lt;/p>
&lt;ol>
&lt;li>&lt;strong>理解 Harness Engineering 的核心概念&lt;/strong>：能够解释 Agent = LLM + Harness 的含义，区分 Model 与 Harness 的职责边界&lt;/li>
&lt;li>&lt;strong>理解 HR（Harness Research）的定位&lt;/strong>：知道如何将驾驭工程的理念应用于科研场景，明白&amp;quot;给 LLM 配置科研的眼睛和手&amp;quot;的含义&lt;/li>
&lt;li>&lt;strong>掌握 Trae 中 MCP 和 Skill 的检索与配置方法&lt;/strong>：能够独立在 skillsmp.com 等平台检索所需工具，并在 Trae 中完成安装配置&lt;/li>
&lt;li>&lt;strong>完成科研基础工具链的搭建&lt;/strong>：成功配置 paper-search-mcp 和 academic-research-skills，并验证其可用性&lt;/li>
&lt;/ol>
&lt;hr>
&lt;h2 id="课后练习">课后练习&lt;/h2>
&lt;h3 id="1-概念理解">1. 概念理解&lt;/h3>
&lt;p>用自己的话解释&amp;quot;为什么同一模型，仅改变 Harness 设计，输出质量可以大幅提升&amp;quot;，并举一个具体的科研场景说明。&lt;/p>
&lt;h3 id="2-工具检索">2. 工具检索&lt;/h3>
&lt;p>在
和
上搜索一个你研究领域的相关 MCP 或 Skill，记录其名称、功能描述、stars 数和最后更新时间。&lt;/p>
&lt;h3 id="3-实操配置">3. 实操配置&lt;/h3>
&lt;p>在 Trae 中完成 &lt;strong>paper-search-mcp&lt;/strong> 的配置，使用它搜索一篇你研究方向的论文，截图搜索结果。&lt;/p>
&lt;h3 id="4-实操配置">4. 实操配置&lt;/h3>
&lt;p>在 Trae 中完成 &lt;strong>academic-research-skills&lt;/strong> 的配置，尝试使用 deep-research 模块对你研究方向做一次快速文献调研。&lt;/p>
&lt;h3 id="5-思考题">5. 思考题&lt;/h3>
&lt;p>如果让你为 LLM 设计一个&amp;quot;科研 Harness&amp;quot;，除了文献检索和论文写作，还需要哪些工具或约束？列出至少 3 项并说明理由。&lt;/p>
&lt;hr>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6">
&lt;p>&lt;strong>Yield Nursing Logic, Optimized.&lt;/strong>&lt;/p>
&lt;/blockquote></description></item></channel></rss>