OpenHarness 通过五个核心子系统,将大语言模型打造为功能完备的智能体。
Agent Harness 是围绕大语言模型构建的完整基础设施,使其成为功能完备的智能体。模型提供智能,框架提供双手、眼睛、记忆和安全边界。
OpenHarness 是一个开源 Python 实现,面向研究者、开发者和社区设计。
一条命令自动处理操作系统检测、依赖检查和安装。
自动检测操作系统(Linux / macOS / WSL),验证 Python ≥ 3.10 和 Node.js ≥ 18
通过 pip 安装 OpenHarness,设置 React TUI(npm install)
创建 ~/.openharness/ 配置目录,生成默认设置
设置 API 密钥,支持 Anthropic、Kimi、DashScope、DeepSeek 等
运行 oh 命令,开始智能体对话,或使用 -p 进行非交互调用
通过 oh --version 确认安装成功
支持三种 API 格式,覆盖主流 LLM 服务商。
| 提供商 | 检测信号 | 说明 |
|---|---|---|
| Anthropic | 未设置自定义 BASE_URL | 默认 Claude 设置 |
| Moonshot / Kimi | BASE_URL 包含 moonshot | Anthropic 兼容端点 |
| Vertex 兼容 | URL 包含 vertex / aiplatform | Vertex 上的 Anthropic 网关 |
| Bedrock 兼容 | URL 包含 bedrock | Bedrock 风格部署 |
| 通用兼容 | 其他显式 BASE_URL | 代理和内部网关 |
| 提供商 | Base URL | 示例模型 |
|---|---|---|
| 阿里云 DashScope | dashscope.aliyuncs.com | qwen3.5-flash、qwen3-max |
| DeepSeek | api.deepseek.com | deepseek-chat、deepseek-reasoner |
| OpenAI | api.openai.com/v1 | gpt-4o、gpt-4o-mini |
| GitHub Models | models.inference.ai.azure.com | gpt-4o、Llama-3.1-405B |
| SiliconFlow | api.siliconflow.cn/v1 | DeepSeek-V3 |
| Groq | api.groq.com/openai/v1 | llama-3.3-70b-versatile |
| Ollama(本地) | localhost:11434/v1 | 任意本地模型 |
| 功能 | 详情 |
|---|---|
| 认证方式 | GitHub OAuth 设备流(无需 API 密钥) |
| 令牌管理 | 自动刷新短期会话令牌 |
| 企业版 | 通过 --github-domain 支持 GitHub Enterprise |
| 模型 | 使用 Copilot 默认模型选择 |
| API | 底层为 OpenAI 兼容 Chat Completions |
通过 10 个子系统实现核心 Agent Harness 模式。
涵盖文件操作、搜索、智能体协调、任务管理、MCP 集成等全方位能力。
带权限检查的核心文件操作
Web 和代码搜索能力
Jupyter 笔记本单元格编辑
子智能体生成与协调
后台任务管理
Model Context Protocol 集成
工作流模式切换
定时与远程执行
知识加载、配置、交互
技能是按需加载的知识 — 仅在模型需要时加载。兼容 anthropics/skills,只需将 .md 文件复制到 ~/.openharness/skills/
兼容 claude-code 插件。已测试 12 个官方插件。
多级安全机制,细粒度控制每一次工具调用。
写入 / 执行前询问,适用于日常开发
允许所有操作,适用于沙箱环境
阻止所有写入,适用于大型重构前审查
全面的测试覆盖,确保每一个 Harness 子系统稳定可靠。
通过自定义工具、技能和插件,让框架适应你的需求。
基于 Pydantic 的类型安全工具定义,继承 BaseTool 即可快速创建。
创建 Markdown 文件,定义领域专家知识,按需加载。
在 commands/ 中添加命令,在 hooks/ 中添加钩子,在 agents/ 中添加智能体。
OpenHarness 是一个社区驱动的研究项目,我们欢迎各领域的贡献。
面向特定领域的新工具实现
金融、科学、DevOps 等领域知识
命令、钩子、智能体工作流
支持更多 LLM 后端
协调协议、团队模式
E2E 场景、基准测试
架构指南、教程、翻译