On this page

caveman - AI Agent 令牌压缩技能

是什么

一个让 AI Agent 以「穴居人」风格极简沟通的插件，旨在大幅降低 LLM 的输出令牌（Output Tokens）消耗，同时保持技术准确性。

GitHub： github.com/JuliusBrussee/caveman
定位： AI Agent 效率增强插件 / 令牌节省工具

解决啥

痛点	方案
LLM 输出太啰嗦，包含大量礼貌用语和废话 $\rightarrow$ 浪费 Token $\rightarrow$ 增加成本	强制 AI 使用极简的「穴居人」说话方式，剔除冠词、修饰词和客套话
响应速度慢 $\rightarrow$ 冗长的输出增加了端到端延迟	极大幅度减少字符数，提升 AI 响应速度和可读性
上下文窗口压力 $\rightarrow$ 历史消息过多导致 Token 溢出	提供 `caveman-compress` 功能，压缩内存文件，降低输入 Token 消耗

怎么跑

根据使用的工具选择安装方式：

Claude Codeclaude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman
Cursor / Windsurf / Copilot / Clinenpx skills add JuliusBrussee/caveman -a [工具名](例如：npx skills add JuliusBrussee/caveman -a cursor)
Gemini CLIgemini extensions install https://github.com/JuliusBrussee/caveman
Codex Clone 仓库 $\rightarrow$ 将其放入 /plugins 目录 $\rightarrow$ 在插件列表中搜索 "Caveman" $\rightarrow$ 安装

好在哪

能力	说明
极高压缩率	输出 Token 平均减少 65% - 75%，输入内存文件减少约 46%
多级强度	提供 `lite`（轻量）、`full`（默认）、`ultra`（极简）以及 `wenyan`（文言文）四种模式
自动清晰度	Auto-Clarity Feature：在涉及安全警告等关键信息时会自动暂时关闭极简模式，确保信息传达准确
技术无损	仅改变表达风格，不影响技术实现的逻辑和准确度

亮点： 这种「风格化压缩」比纯算法压缩更符合人类阅读习惯，且无需复杂配置，安装即用。

怎么用

快速调试： 在进行频繁的 Debug 循环时开启，快速获取答案，无需读 500 字的开场白。
自动化 Code Review： 生成极简的评审意见（位置 $\rightarrow$ 问题 $\rightarrow$ 修复），提高审查效率。
CI 流程集成： 集成到持续集成流水线中，通过降低 Token 消耗来直接削减 API 账单。

by 文殊