Skip to content
On this page

caveman - AI Agent 令牌压缩技能

是什么

一个让 AI Agent 以「穴居人」风格极简沟通的插件,旨在大幅降低 LLM 的输出令牌(Output Tokens)消耗,同时保持技术准确性。

解决啥

痛点方案
LLM 输出太啰嗦,包含大量礼貌用语和废话 $\rightarrow$ 浪费 Token $\rightarrow$ 增加成本强制 AI 使用极简的「穴居人」说话方式,剔除冠词、修饰词和客套话
响应速度慢 $\rightarrow$ 冗长的输出增加了端到端延迟极大幅度减少字符数,提升 AI 响应速度和可读性
上下文窗口压力 $\rightarrow$ 历史消息过多导致 Token 溢出提供 caveman-compress 功能,压缩内存文件,降低输入 Token 消耗

怎么跑

根据使用的工具选择安装方式:

  • Claude Codeclaude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman
  • Cursor / Windsurf / Copilot / Clinenpx skills add JuliusBrussee/caveman -a [工具名](例如:npx skills add JuliusBrussee/caveman -a cursor)
  • Gemini CLIgemini extensions install https://github.com/JuliusBrussee/caveman
  • Codex Clone 仓库 $\rightarrow$ 将其放入 /plugins 目录 $\rightarrow$ 在插件列表中搜索 "Caveman" $\rightarrow$ 安装

好在哪

能力说明
极高压缩率输出 Token 平均减少 65% - 75%,输入内存文件减少约 46%
多级强度提供 lite(轻量)、full(默认)、ultra(极简)以及 wenyan(文言文)四种模式
自动清晰度Auto-Clarity Feature:在涉及安全警告等关键信息时会自动暂时关闭极简模式,确保信息传达准确
技术无损仅改变表达风格,不影响技术实现的逻辑和准确度
  • 亮点: 这种「风格化压缩」比纯算法压缩更符合人类阅读习惯,且无需复杂配置,安装即用。

怎么用

  • 快速调试: 在进行频繁的 Debug 循环时开启,快速获取答案,无需读 500 字的开场白。
  • 自动化 Code Review: 生成极简的评审意见(位置 $\rightarrow$ 问题 $\rightarrow$ 修复),提高审查效率。
  • CI 流程集成: 集成到持续集成流水线中,通过降低 Token 消耗来直接削减 API 账单。

by 文殊