常见问题

一般问题

什么是 Skill Seekers?

Skill Seekers 是AI 系统的通用数据层。它自动将文档网站、GitHub 仓库、PDF 文件和本地代码库转换为适用于以下用途的结构化知识:

  • RAG 管道 - LangChain、LlamaIndex、Chroma、FAISS、Haystack、Qdrant、Weaviate
  • AI 编码助手 - Cursor、Windsurf、Cline、Continue.dev
  • Claude AI 技能 - 带 YAML 前置元数据的原生格式
  • 任何 LLM 平台 - 通用 Markdown、JSON、YAML

它是免费的吗?

是的!Skill Seekers 是 100% 免费和开源(MIT 许可证)。您只需支付:

  • Claude API(如果使用 API 增强模式)- 每个技能约 $0.15-$0.30
  • 您的 Claude Max 订阅(如果使用本地增强 - 推荐!)
  • 云存储(如果上传到 S3/GCS/Azure)

大多数功能完全免费,包括使用 Claude Code 的本地 AI 增强。

支持哪些平台?

输入源(4 种):

  • 文档网站(任何 HTML 文档)
  • GitHub 仓库(公共和私有)
  • PDF 文件(扫描文档支持 OCR)
  • 本地代码库(27+ 语言)

输出格式(16 种):

  • RAG/向量: LangChain、LlamaIndex、Chroma、FAISS、Haystack、Qdrant、Weaviate
  • AI 平台: Claude、Gemini、OpenAI
  • AI 编码: Cursor、Windsurf、Cline、Continue.dev
  • 通用: Markdown、JSON、YAML

所有功能在所有平台上都能使用,具有完整的功能对等性。


安装和设置

有什么要求?

  • Python 3.10+(必需)
  • pipuv 包管理器
  • Git(用于 GitHub 抓取)
  • Tesseract OCR(可选,用于扫描的 PDF)

如何安装?

pip install skill-seekers

就这样!详细说明请参阅安装指南

我需要安装 Claude Code 吗?

不需要,但强烈推荐!使用 Claude Code,您可以使用免费的本地 AI 增强(使用您的 Claude Max 订阅,无 API 费用)。

没有 Claude Code,您仍然可以:

  • 抓取文档(完美运行)
  • 打包技能(完美运行)
  • 手动上传(完美运行)
  • 使用 API 增强(每个技能约 $0.30)

使用问题

创建技能需要多长时间?

典型时间线:

  • 小型文档(50 页):2-3 分钟
  • 中型文档(200 页):5-10 分钟
  • 大型文档(1000+ 页):15-30 分钟
  • GitHub 仓库分析:3-10 分钟
  • PDF 提取:1-5 分钟
  • 本地代码库:5-15 分钟
  • AI 增强:30-60 秒(本地)或 10-30 秒(API)

React 文档总计: 从开始到结束约 12 分钟!

我可以在没有互联网的情况下使用它吗?

部分可以:

  • 可以离线工作: PDF 提取、本地文件分析、本地代码库
  • 需要互联网: 文档抓取、GitHub API 调用、API 增强、上传

抓取的准确性如何?

非常准确,配置正确时:

  • 智能选择器 - 自动检测内容与导航
  • 类别检测 - 对于结构良好的文档,准确率 95%+
  • 代码保留 - 代码块 100% 准确
  • 链接解析 - 正确处理内部引用

获得最佳结果的提示:

  • 使用交互模式测试选择器
  • 首先检查现有配置(24 个预设可用)
  • 在完整抓取之前使用 skill-seekers estimate 验证

功能问题

本地和 API 增强有什么区别?

功能本地(免费)API
费用免费(使用 Claude Max)每个技能约 $0.15-$0.30
速度30-60 秒10-30 秒
质量相同(Claude Sonnet)相同
要求已安装 Claude CodeANTHROPIC_API_KEY
用例单个技能、开发批处理、CI/CD

推荐: 开发使用本地模式,自动化使用 API。

我可以抓取私有文档吗?

是的!有几种选择:

  1. VPN/网络访问 - 从内部网络抓取
  2. 本地 HTML - 本地下载文档,然后抓取
  3. 身份验证 - 配置自定义标头/cookie
  4. 私有 GitHub - 使用 GITHUB_TOKEN 访问私有仓库

详情请参阅 GitHub 分析教程

如何处理大型文档(10K+ 页)?

使用配置拆分路由器生成

# 自动拆分大型配置
skill-seekers split --config configs/large-docs.json

# 生成路由器技能
skill-seekers router output/large-docs-*/

这会创建专注的子技能,并带有智能路由。详情请参阅大型文档指南

我可以组合多个源吗?

是的!使用统一抓取

skill-seekers unified --config configs/unified.json

将文档 + GitHub + PDF + 代码库组合成一个全面的技能。请参阅多源教程

我可以处理本地代码库吗?

是的!使用 analyze 命令:

# 分析本地项目
skill-seekers analyze --directory ./my-project --format langchain

# 分析 Godot 游戏
skill-seekers analyze --directory ./my-game --comprehensive

支持 27+ 编程语言,包括 Python、JavaScript、Go、Rust、C++、C#、GDScript 等。


平台特定问题

我需要为不同的 AI 系统准备不同的技能吗?

不需要!创建一次,打包为任何平台:

# 创建技能(适用于所有源)
skill-seekers scrape --config configs/react.json

# 打包为不同平台
skill-seekers package output/react/ --target langchain
skill-seekers package output/react/ --target llamaindex
skill-seekers package output/react/ --target claude

RAG 集成如何工作?

  • LangChain: 带元数据的原生 Document 对象
  • LlamaIndex: 带嵌入的 TextNode 对象
  • 向量数据库: 直接导出到 Chroma、Weaviate、FAISS、Qdrant
  • 分块: 智能语义分块(512 令牌)

详情请参阅 RAG 与向量数据库

AI 编码集成如何工作?

  • Cursor: 带有框架知识的 .cursorrules 文件
  • Windsurf: .windsurfrules 文件
  • Cline: .clinerules + MCP 工具
  • Continue.dev: HTTP 上下文提供程序

所有这些都适用于文档、仓库、PDF 和代码库。


故障排除

为什么抓取很慢?

常见原因:

  • 速率限制 - 在配置中增加 rate_limit(尝试 1.0 或 2.0)
  • 同步模式 - 使用 --async 标志提速 2-3 倍
  • 大页面 - 1000+ 页面网站正常
  • 网络问题 - 检查互联网连接

为什么有些页面缺失?

检查:

  1. max_pages 限制 - 删除或增加限制
  2. URL 模式 - 向配置添加 url_patterns
  3. 选择器 - 使用 --interactive 模式测试
  4. JavaScript 渲染 - 某些网站需要浏览器自动化

如何调试选择器问题?

# 交互模式显示提取的内容
skill-seekers scrape --config configs/test.json --interactive

# 在单个页面上测试
skill-seekers estimate --config configs/test.json

更多帮助请参阅故障排除指南

为什么增强失败?

常见问题:

  • 没有 ANTHROPIC_API_KEY - 为 API 模式设置环境变量
  • 未安装 Claude Code - 为本地模式安装
  • 超时 - 增加 --timeout 标志(默认:600 秒)
  • 文件权限 - 检查输出目录的写入权限

MCP 问题

什么是 MCP?

MCP(模型上下文协议)是连接 AI 工具的标准。Skill Seekers 为 Claude Code Desktop 提供 26 个 MCP 工具,允许自然语言命令如”创建 React 技能”。

如何设置 MCP?

# 自动设置(推荐)
cd /path/to/Skill_Seekers
./setup_mcp.sh

# 手动设置
# 编辑 ~/.claude/mcp_settings.json

详情请参阅 MCP 设置指南

哪些 AI 代理支持 MCP?

  • Claude Code - stdio 传输(原生)
  • GitHub Copilot CLI - 企业集成
  • OpenAI Codex CLI - OpenAI 集成
  • OpenCode CLI - 开源替代方案
  • Cursor - HTTP 传输
  • Windsurf - HTTP 传输

设置脚本自动检测并配置所有已安装的代理。


高级问题

我可以自定义 AI 增强吗?

是的!增强使用可配置的提示。您可以:

  • 在配置中修改增强指令
  • 使用不同的 AI 模型(Claude、Gemini、GPT-4o)
  • 完全跳过增强(--skip-enhancement
  • 稍后手动增强(skill-seekers enhance output/skill/

我可以贡献配置吗?

当然!我们欢迎社区配置:

# 通过 MCP 提交
submit_config(config_json="...", description="...")

# 或创建 GitHub 问题
# https://github.com/yusufkaraaslan/Skill_Seekers/issues

详情请参阅贡献指南

有路线图吗?

有的!请参阅路线图了解计划功能,更新日志了解版本历史。


获取帮助

找不到答案?

发现错误? 请报告并提供:

  • 重现步骤
  • 预期与实际行为
  • 错误消息和堆栈跟踪
  • 环境详情(操作系统、Python 版本、配置文件)