kaijibot

v2026.6.18-1

Published

5 hours ago

Proactive cognitive AI assistant — learns your interests, pushes insights, evolves skills autonomously

0High
0Medium
0Low

kaiji1126

ai chatbot cognitive feishu glm lark lmstudio ollama proactive-ai zhipu

KaijiBot 👾

你的 AI 助手会主动找你聊天，而不是干等着你提问。

可插拔 provider/channel 架构 · 认知层让 AI 从被动变主动 · 30+ LLM 提供商

README | English | 简体中文

为什么是 KaijiBot

你用过的 AI 助手都一个模式：你问，它答。你不问，它就安静地待在那里。

KaijiBot 不一样。它在飞书里跟你聊了几次之后，会开始主动给你发消息。不是广告，不是提醒喝水，而是你真正可能感兴趣的东西。

| | 普通聊天机器人 | KaijiBot | | ------------ | -------------------- | ---------------------------------------------- | | 交互方式 | 你问它才答 | 主动推送洞察 + 正常对话 | | 用户理解 | 无状态，每次从零开始 | 持续学习你的兴趣、领域、偏好 | | 时机感知 | 不管你在干嘛 | 尊重活跃时段、信任阶段、对话频率 | | 中文支持 | 英文优先，中文常掉队 | 中文原生优化，模式路由、画像提取均针对中文设计 | | 渠道集成 | 需要 Web/SDK 接入 | 飞书即终端，发消息就能用 |

✨ 核心特性

🔮 认知引擎 — 从被动回复到主动洞察

你在飞书里跟 KaijiBot 聊了几次 AI 架构和分布式系统，下周它主动发来一条消息：

"最近看到一篇关于用 eBPF 做分布式追踪的文章，结合你之前关注的可观测性方向，可能有启发。"

这不是预设推送，是 KaijiBot 真正理解了你之后产生的洞察。

再过两周，你又聊了几个关于 Rust 和嵌入式的话题。某天它告诉你：

"你最近在学 Rust，同时之前对嵌入式系统感兴趣，这两者的交集里有一篇关于用 Rust 写 RTOS 内核的实战文章，值得看看。"

它怎么做到的：

Persona 画像 — 每次对话都在学习你。LLM 驱动的结构化提取，从对话中自动发现领域和兴趣。洞察按类别独立衰减，兴趣生命周期自动追踪。领域由 LLM 动态发现，不依赖硬编码关键词。
跨域洞察 — 你同时关注 A 和 B，它发现二者有潜在联系。你之前问过但没深入的问题，它从新角度跟进。你在某个领域钻得够深了，它推荐延伸方向。LLM 自我精炼保证质量，语义去重确保每次推送都有新意。
时机门控 — 不是想发就发。PRISM 模型计算每条洞察的期望价值，只有预期收益超过打扰成本时才推送。凌晨不打扰，信任度低时克制，你最近活跃度低就先等等。
信任演化 — 刚认识时谨慎试探，聊多了越来越懂你，最终变成可以大胆推荐的深度伙伴。SARA 框架驱动四个阶段的信任演化，信任等级决定系统被允许做什么。
偏好学习 — 你回复长了、追问了"为什么"，它记下你喜欢这个话题。你敷衍了，它下次换一个方向。Thompson Sampling 驱动的偏好学习，隐式反馈比显式反馈更诚实。

洞察内容结合你的画像 + LLM 知识 + 实时网络搜索生成。配了搜索 API Key，洞察会紧跟时事。

🧬 自我进化 — Agent 自主判断何时学新技能

你跟 KaijiBot 连续做了几次复杂的飞书知识库整理操作——搜索会议记录、提取纪要、创建文档、设置任务。KaijiBot 发现这个流程重复且复杂，主动跟你说：

"我注意到你最近几次都在做类似的会议纪要归档流程，我给自己写了个技能，以后你说'归档会议'我就自动执行整个流程。"

它怎么做到的：

Hard Trigger 检测 — 代码层只做噪音过滤，不做质量判断。检测到复杂任务后注入系统事件。
Agent 自主决策 — Agent 拥有完整对话上下文，自己判断是否值得做成技能。不值得就忽略。
完整生命周期 — 创建前去重检查、创建后跟踪使用频率、长期不用自动清理。

🔄 纠错自进化 — 同样的错误不犯第二次

AI 助手每次新建会话都犯同样的错？KaijiBot 不会。它有一套纠错记忆系统，保证同样的错误只犯一次。

双路径检测 — Agent 自报错误，或会话结束时系统自动从对话中提取纠错记录。
去重 + 强化 — 重复的错误不会新建记录，而是增加权重，确保高频问题优先被看到。
系统提示注入 — 纠错记录注入到 Agent 每一轮都能看到的系统提示中，而不是放在可能不被读取的文件里。

同样的坑，踩过一次就够了。

🔌 可插拔架构

不绑死任何一家。国内国际随意切换，kaijibot onboard 向导自动发现已配置的 API Key。

| 国内（推荐） | 国际主流 | 聚合 / 自部署 | | ------------------------------------------------- | ----------------------------------------------- | -------------------------------------------------- | | 智谱 GLM · DeepSeek · 通义千问 · Kimi · MiniMax … | Claude · Gemini · Grok · Mistral · Perplexity … | OpenRouter · Together · Ollama · LMStudio · vLLM … |

切换模型只需一行：

kaijibot config set agent.model "deepseek/deepseek-chat"
kaijibot config set agent.model "anthropic/claude-sonnet-4-20250514"

🛠️ 完整智能体

Agent 循环：推理 → 调用工具 → 观察 → 继续推理，支持流式输出、上下文压缩、子智能体并行派生。内置代码执行、网页抓取、PDF 操作、图片/视频/音乐生成、TTS 语音合成、Canvas 画布等工具。

记忆系统：多存储后端，语义搜索历史对话。会话记忆、每日整合、手动整理三个系统协同维护 Agent 上下文。

会话记忆 — 每次对话结束自动生成结构化摘要（决策、待办、话题），按日期归档到 memory/YYYY-MM-DD.md，按话题拆分到独立主题文件。8KB 预算自动平衡，高频内容内联，低频内容存指针。
每日整合 — 定时扫描历史会话，LLM 提取结构化知识（领域知识、行为模式、偏好、目标），Jaccard 去重后写入 Persona 画像、Fragment 片段库和纠错存储。你的认知模型每天都在进化。
智能检索 — 双引擎架构：FTS 全文搜索 + sqlite-vec 向量语义搜索（配 embedding provider 后启用）。混合检索自动平衡关键词匹配和语义相关性。
手动整理 — 内置 memory-organize 技能，四步流程：垃圾回收（清理过期内容）→ 深度扫描（发现遗漏）→ 整理去重（跨文件消重）→ 预算检查（保持精简）。

技能市场：数十个内置技能（github、weather、summarize、coding-agent、notion、obsidian、taskflow 等），更多从 ClawHub 安装：

kaijibot skills install <skill-name>

🚀 快速开始

npm 全局安装

npm install -g kaijibot
kaijibot onboard

Docker

git clone https://github.com/Kaiji-Z/kaijibot.git
cd kaijibot
docker compose up -d

从源码构建

git clone https://github.com/Kaiji-Z/kaijibot.git
cd kaijibot
# 国内镜像加速
pnpm install --registry https://registry.npmmirror.com
pnpm build
kaijibot onboard   # 交互式向导，自动配置
# 从 OpenClaw 迁移？运行：
kaijibot migrate

启动

kaijibot gateway --port 18789 --verbose

启动后在飞书里找到你的机器人，发一条消息。KaijiBot 自动开始构建你的认知画像，几轮对话后会主动推送第一条洞察。

⚙️ 配置

必需：至少一个 LLM 提供商的 API Key + 飞书机器人凭证。

# LLM API Key（任选一个）
export ZAI_API_KEY="your-key"              # 智谱 GLM
# export DEEPSEEK_API_KEY="your-key"       # DeepSeek
# export ANTHROPIC_API_KEY="your-key"      # Claude
# export GOOGLE_API_KEY="your-key"         # Gemini

# 飞书频道
kaijibot config set channels.feishu.appId "your-app-id"
kaijibot config set channels.feishu.appSecret "your-app-secret"

可选：网络搜索增强洞察时效性。

export EXA_API_KEY="your-key"
export TAVILY_API_KEY="your-key"

配置文件位于 ~/.kaijibot/kaijibot.json，支持热重载。认知系统可通过 cognitive.enabled: false 关闭。详细配置参考 AGENTS.md。

致谢

基于 OpenClaw 开源项目开发。

学术研究

认知系统的设计借鉴了以下研究：

基础理论

Green, D. M., & Swets, J. A. (1966). Signal detection theory and psychophysics. Wiley.
Thompson, W. R. (1933). On the likelihood that one unknown probability exceeds another in view of the evidence of two samples. Biometrika, 25(3/4), 285–294.
Altman, I., & Taylor, D. A. (1973). Social penetration: The development of interpersonal relationships. Holt, Rinehart & Winston.
Gentner, D. (1983). Structure-mapping: A theoretical framework for analogy. Cognitive Science, 7(2), 155–170.

人机关系与推荐系统

Bickmore, T. W., & Picard, R. W. (2005). Establishing and maintaining long-term human-computer relationships. ACM Transactions on Computer-Human Interaction, 12(2), 293–327.
Kotkov, D., Wang, S., & Veijalainen, J. (2016). A survey of serendipity in recommender systems. Knowledge-Based Systems, 111, 180–192.

LLM 画像与记忆

DEEPER: Directed Persona Refinement. (2025). Proceedings of ACL 2025. 32.2% error reduction via active contradiction resolution in persona maintenance.
PERSONAMEM: Persona-Aware Memory in LLMs. (2025). Proceedings of COLM 2025. Benchmark showing LLMs achieve ~50% accuracy on evolving profile tasks.
DV365: Dynamic User Representations over 365 Days. (2025). Proceedings of KDD 2025. Instagram's multi-slicing user embedding architecture.
GemiRec: Gemini-Powered Recommendations. (2025). Xiaohongshu's multi-interest vector architecture with codebook quantization.
PIE: Personalized Interest Exploration. (2023). Proceedings of WWW 2023. Personalized PageRank with bandit exploration.
ProfiLLM: Fully Implicit User Profiling from Chatbot Interactions. (2025).

开源依赖

飞书开放平台、Vitest、Playwright、tsdown、Zod。

许可证

MIT