常见问题
一般问题
什么是 Skill Seekers?
Skill Seekers 是AI 系统的通用数据层。它自动将文档网站、GitHub 仓库、PDF 文件和本地代码库转换为适用于以下用途的结构化知识:
- RAG 管道 - LangChain、LlamaIndex、Chroma、FAISS、Haystack、Qdrant、Weaviate
- AI 编码助手 - Cursor、Windsurf、Cline、Continue.dev
- Claude AI 技能 - 带 YAML 前置元数据的原生格式
- 任何 LLM 平台 - 通用 Markdown、JSON、YAML
它是免费的吗?
是的!Skill Seekers 是 100% 免费和开源(MIT 许可证)。您只需支付:
- Claude API(如果使用 API 增强模式)- 每个技能约 $0.15-$0.30
- 您的 Claude Max 订阅(如果使用本地增强 - 推荐!)
- 云存储(如果上传到 S3/GCS/Azure)
大多数功能完全免费,包括使用 Claude Code 的本地 AI 增强。
支持哪些平台?
输入源(4 种):
- 文档网站(任何 HTML 文档)
- GitHub 仓库(公共和私有)
- PDF 文件(扫描文档支持 OCR)
- 本地代码库(27+ 语言)
输出格式(16 种):
- RAG/向量: LangChain、LlamaIndex、Chroma、FAISS、Haystack、Qdrant、Weaviate
- AI 平台: Claude、Gemini、OpenAI
- AI 编码: Cursor、Windsurf、Cline、Continue.dev
- 通用: Markdown、JSON、YAML
所有功能在所有平台上都能使用,具有完整的功能对等性。
安装和设置
有什么要求?
- Python 3.10+(必需)
- pip 或 uv 包管理器
- Git(用于 GitHub 抓取)
- Tesseract OCR(可选,用于扫描的 PDF)
如何安装?
pip install skill-seekers
就这样!详细说明请参阅安装指南。
我需要安装 Claude Code 吗?
不需要,但强烈推荐!使用 Claude Code,您可以使用免费的本地 AI 增强(使用您的 Claude Max 订阅,无 API 费用)。
没有 Claude Code,您仍然可以:
- 抓取文档(完美运行)
- 打包技能(完美运行)
- 手动上传(完美运行)
- 使用 API 增强(每个技能约 $0.30)
使用问题
创建技能需要多长时间?
典型时间线:
- 小型文档(50 页):2-3 分钟
- 中型文档(200 页):5-10 分钟
- 大型文档(1000+ 页):15-30 分钟
- GitHub 仓库分析:3-10 分钟
- PDF 提取:1-5 分钟
- 本地代码库:5-15 分钟
- AI 增强:30-60 秒(本地)或 10-30 秒(API)
React 文档总计: 从开始到结束约 12 分钟!
我可以在没有互联网的情况下使用它吗?
部分可以:
- ✅ 可以离线工作: PDF 提取、本地文件分析、本地代码库
- ❌ 需要互联网: 文档抓取、GitHub API 调用、API 增强、上传
抓取的准确性如何?
非常准确,配置正确时:
- 智能选择器 - 自动检测内容与导航
- 类别检测 - 对于结构良好的文档,准确率 95%+
- 代码保留 - 代码块 100% 准确
- 链接解析 - 正确处理内部引用
获得最佳结果的提示:
- 使用交互模式测试选择器
- 首先检查现有配置(24 个预设可用)
- 在完整抓取之前使用
skill-seekers estimate验证
功能问题
本地和 API 增强有什么区别?
| 功能 | 本地(免费) | API |
|---|---|---|
| 费用 | 免费(使用 Claude Max) | 每个技能约 $0.15-$0.30 |
| 速度 | 30-60 秒 | 10-30 秒 |
| 质量 | 相同(Claude Sonnet) | 相同 |
| 要求 | 已安装 Claude Code | ANTHROPIC_API_KEY |
| 用例 | 单个技能、开发 | 批处理、CI/CD |
推荐: 开发使用本地模式,自动化使用 API。
我可以抓取私有文档吗?
是的!有几种选择:
- VPN/网络访问 - 从内部网络抓取
- 本地 HTML - 本地下载文档,然后抓取
- 身份验证 - 配置自定义标头/cookie
- 私有 GitHub - 使用 GITHUB_TOKEN 访问私有仓库
详情请参阅 GitHub 分析教程。
如何处理大型文档(10K+ 页)?
使用配置拆分和路由器生成:
# 自动拆分大型配置
skill-seekers split --config configs/large-docs.json
# 生成路由器技能
skill-seekers router output/large-docs-*/
这会创建专注的子技能,并带有智能路由。详情请参阅大型文档指南。
我可以组合多个源吗?
是的!使用统一抓取:
skill-seekers unified --config configs/unified.json
将文档 + GitHub + PDF + 代码库组合成一个全面的技能。请参阅多源教程。
我可以处理本地代码库吗?
是的!使用 analyze 命令:
# 分析本地项目
skill-seekers analyze --directory ./my-project --format langchain
# 分析 Godot 游戏
skill-seekers analyze --directory ./my-game --comprehensive
支持 27+ 编程语言,包括 Python、JavaScript、Go、Rust、C++、C#、GDScript 等。
平台特定问题
我需要为不同的 AI 系统准备不同的技能吗?
不需要!创建一次,打包为任何平台:
# 创建技能(适用于所有源)
skill-seekers scrape --config configs/react.json
# 打包为不同平台
skill-seekers package output/react/ --target langchain
skill-seekers package output/react/ --target llamaindex
skill-seekers package output/react/ --target claude
RAG 集成如何工作?
- LangChain: 带元数据的原生 Document 对象
- LlamaIndex: 带嵌入的 TextNode 对象
- 向量数据库: 直接导出到 Chroma、Weaviate、FAISS、Qdrant
- 分块: 智能语义分块(512 令牌)
详情请参阅 RAG 与向量数据库。
AI 编码集成如何工作?
- Cursor: 带有框架知识的
.cursorrules文件 - Windsurf:
.windsurfrules文件 - Cline:
.clinerules+ MCP 工具 - Continue.dev: HTTP 上下文提供程序
所有这些都适用于文档、仓库、PDF 和代码库。
故障排除
为什么抓取很慢?
常见原因:
- 速率限制 - 在配置中增加
rate_limit(尝试 1.0 或 2.0) - 同步模式 - 使用
--async标志提速 2-3 倍 - 大页面 - 1000+ 页面网站正常
- 网络问题 - 检查互联网连接
为什么有些页面缺失?
检查:
- max_pages 限制 - 删除或增加限制
- URL 模式 - 向配置添加
url_patterns - 选择器 - 使用
--interactive模式测试 - JavaScript 渲染 - 某些网站需要浏览器自动化
如何调试选择器问题?
# 交互模式显示提取的内容
skill-seekers scrape --config configs/test.json --interactive
# 在单个页面上测试
skill-seekers estimate --config configs/test.json
更多帮助请参阅故障排除指南。
为什么增强失败?
常见问题:
- 没有 ANTHROPIC_API_KEY - 为 API 模式设置环境变量
- 未安装 Claude Code - 为本地模式安装
- 超时 - 增加
--timeout标志(默认:600 秒) - 文件权限 - 检查输出目录的写入权限
MCP 问题
什么是 MCP?
MCP(模型上下文协议)是连接 AI 工具的标准。Skill Seekers 为 Claude Code Desktop 提供 26 个 MCP 工具,允许自然语言命令如”创建 React 技能”。
如何设置 MCP?
# 自动设置(推荐)
cd /path/to/Skill_Seekers
./setup_mcp.sh
# 手动设置
# 编辑 ~/.claude/mcp_settings.json
详情请参阅 MCP 设置指南。
哪些 AI 代理支持 MCP?
- Claude Code - stdio 传输(原生)
- GitHub Copilot CLI - 企业集成
- OpenAI Codex CLI - OpenAI 集成
- OpenCode CLI - 开源替代方案
- Cursor - HTTP 传输
- Windsurf - HTTP 传输
设置脚本自动检测并配置所有已安装的代理。
高级问题
我可以自定义 AI 增强吗?
是的!增强使用可配置的提示。您可以:
- 在配置中修改增强指令
- 使用不同的 AI 模型(Claude、Gemini、GPT-4o)
- 完全跳过增强(
--skip-enhancement) - 稍后手动增强(
skill-seekers enhance output/skill/)
我可以贡献配置吗?
当然!我们欢迎社区配置:
# 通过 MCP 提交
submit_config(config_json="...", description="...")
# 或创建 GitHub 问题
# https://github.com/yusufkaraaslan/Skill_Seekers/issues
详情请参阅贡献指南。
有路线图吗?
获取帮助
找不到答案?
- 📚 文档 - 综合指南
- 🐛 GitHub Issues - 报告错误
- 💬 Discussions - 提问
- 📧 Email - 直接支持
发现错误? 请报告并提供:
- 重现步骤
- 预期与实际行为
- 错误消息和堆栈跟踪
- 环境详情(操作系统、Python 版本、配置文件)