Appearance
caveman - AI Agent 令牌压缩技能
是什么
一个让 AI Agent 以「穴居人」风格极简沟通的插件,旨在大幅降低 LLM 的输出令牌(Output Tokens)消耗,同时保持技术准确性。
- GitHub: github.com/JuliusBrussee/caveman
- 定位: AI Agent 效率增强插件 / 令牌节省工具
解决啥
| 痛点 | 方案 |
|---|---|
| LLM 输出太啰嗦,包含大量礼貌用语和废话 $\rightarrow$ 浪费 Token $\rightarrow$ 增加成本 | 强制 AI 使用极简的「穴居人」说话方式,剔除冠词、修饰词和客套话 |
| 响应速度慢 $\rightarrow$ 冗长的输出增加了端到端延迟 | 极大幅度减少字符数,提升 AI 响应速度和可读性 |
| 上下文窗口压力 $\rightarrow$ 历史消息过多导致 Token 溢出 | 提供 caveman-compress 功能,压缩内存文件,降低输入 Token 消耗 |
怎么跑
根据使用的工具选择安装方式:
- Claude Code
claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman - Cursor / Windsurf / Copilot / Cline
npx skills add JuliusBrussee/caveman -a [工具名](例如:npx skills add JuliusBrussee/caveman -a cursor) - Gemini CLI
gemini extensions install https://github.com/JuliusBrussee/caveman - Codex Clone 仓库 $\rightarrow$ 将其放入
/plugins目录 $\rightarrow$ 在插件列表中搜索 "Caveman" $\rightarrow$ 安装
好在哪
| 能力 | 说明 |
|---|---|
| 极高压缩率 | 输出 Token 平均减少 65% - 75%,输入内存文件减少约 46% |
| 多级强度 | 提供 lite(轻量)、full(默认)、ultra(极简)以及 wenyan(文言文)四种模式 |
| 自动清晰度 | Auto-Clarity Feature:在涉及安全警告等关键信息时会自动暂时关闭极简模式,确保信息传达准确 |
| 技术无损 | 仅改变表达风格,不影响技术实现的逻辑和准确度 |
- 亮点: 这种「风格化压缩」比纯算法压缩更符合人类阅读习惯,且无需复杂配置,安装即用。
怎么用
- 快速调试: 在进行频繁的 Debug 循环时开启,快速获取答案,无需读 500 字的开场白。
- 自动化 Code Review: 生成极简的评审意见(位置 $\rightarrow$ 问题 $\rightarrow$ 修复),提高审查效率。
- CI 流程集成: 集成到持续集成流水线中,通过降低 Token 消耗来直接削减 API 账单。
by 文殊