v3.0.0 发布 langchain llamaindex cursor claude
Skill Seekers v3.0.0:通用智能平台
将文档、GitHub 仓库、PDF 和代码库转换为适用于任何 AI 系统的结构化知识。16 种输出格式。1,852 个测试。一个工具支持 LangChain、LlamaIndex、Cursor、Claude 等。
Skill Seekers 团队 •
Skill Seekers v3.0.0:通用智能平台
太长不看
- 🚀 16 种输出格式(v2.x 只有 4 种)
- 🛠️ 26 个 MCP 工具(之前是 9 个)
- ✅ 1,852 个测试通过(之前是 700+)
- ☁️ 云存储支持(S3、GCS、Azure)
- 🔄 CI/CD 就绪(GitHub Action + Docker)
- 🎮 Godot 游戏引擎支持,带信号流分析
- 🌐 27+ 编程语言(新增 7 种)
- 📚 4 种输入源:文档、GitHub 仓库、PDF、本地代码库
pip install skill-seekers
skill-seekers scrape --config react.json
我们要解决的问题
每个 AI 项目都需要数据预处理:
- RAG 管道:“抓取这些文档/仓库/PDF,分块,嵌入…”
- AI 编码工具:“我希望 Cursor 了解这个框架/API…”
- Claude 技能:“将这个代码库转换为技能”
**70% 的 RAG 开发时间花在数据预处理上。**每个人都在重复构建相同的基础设施。停止重复造轮子。开始使用。
解决方案:通用预处理器
Skill Seekers v3.0.0 将文档、GitHub 仓库、PDF 和本地代码库转换为适用于任何 AI 系统的结构化知识:
用于 RAG 管道
# 从文档
skill-seekers scrape --format langchain --config react.json
# 从 GitHub 仓库
skill-seekers scrape --format langchain --github https://github.com/user/repo
# 从 PDF
skill-seekers scrape --format langchain --pdf ./manual.pdf
# 从本地代码库
skill-seekers analyze --directory ./my-project --format langchain
用于 AI 编码助手
# 适用于任何源——文档、仓库或代码库
skill-seekers scrape --target claude --config react.json
cp output/react-claude/.cursorrules ./
# Windsurf、Cline、Continue.dev - 同样流程
用于 Claude AI
skill-seekers install --config react.json
# 自动获取、抓取、增强、打包、上传
v3.0.0 新增功能
4 种输入源
| 源 | 命令 | 用例 |
|---|---|---|
| 文档 | scrape --config | 框架文档、API、指南 |
| GitHub 仓库 | scrape --github | 开源库、工具 |
| PDF 文件 | scrape --pdf | 手册、研究论文、书籍 |
| 本地代码库 | analyze --directory | 您自己的项目、游戏引擎 |
16 个平台适配器
| 类别 | 平台 | 命令 |
|---|---|---|
| RAG/向量 | LangChain、LlamaIndex、Chroma、FAISS、Haystack、Qdrant、Weaviate | --format <名称> |
| AI 平台 | Claude、Gemini、OpenAI | --target <名称> |
| AI 编码 | Cursor、Windsurf、Cline、Continue.dev | --target claude |
| 通用 | Markdown | --target markdown |
26 个 MCP 工具
您的 AI 代理现在可以准备自己的知识:
- 配置工具(3 个):generate_config、list_configs、validate_config
- 抓取工具(8 个):estimate_pages、scrape_docs、scrape_github、scrape_pdf、scrape_codebase、detect_patterns、extract_test_examples、build_how_to_guides
- 打包工具(4 个):package_skill、upload_skill、enhance_skill、install_skill
- 源工具(5 个):fetch_config、submit_config、add/remove_config_source、list_config_sources
- 拆分工具(2 个):split_config、generate_router
- 向量数据库工具(4 个):export_to_weaviate、export_to_chroma、export_to_faiss、export_to_qdrant
云存储
直接将技能上传到云存储:
# AWS S3
skill-seekers cloud upload output/react/ --provider s3 --bucket my-bucket
# Google Cloud Storage
skill-seekers cloud upload output/react/ --provider gcs --bucket my-bucket
# Azure Blob Storage
skill-seekers cloud upload output/react/ --provider azure --container my-container
CI/CD 就绪
GitHub Action:
- uses: skill-seekers/action@v1
with:
config: configs/react.json
format: langchain
Docker:
docker run -v $(pwd):/data skill-seekers:latest scrape --config /data/config.json
Godot 游戏引擎支持
完整的 Godot 4.x 分析,带信号流检测:
skill-seekers analyze --directory ./my-godot-game --comprehensive
检测:
- 信号声明和连接
- 事件模式(EventBus、Observer、事件链)
- GDScript 测试提取(GUT、gdUnit4)
扩展语言支持
7 种新语言: Dart、Scala、SCSS/SASS、Elixir、Lua、Perl
总计:支持 27+ 编程语言
生产质量
- ✅ 1,852 个测试,分布在 100 个测试文件中
- ✅ 58,512 行 Python 代码
- ✅ 80+ 个文档文件
- ✅ 12 个示例项目,涵盖每个集成
快速开始
# 安装
pip install skill-seekers
# 创建配置
skill-seekers config --wizard
# 或使用预设
skill-seekers scrape --config configs/react.json
# 打包为您的平台
skill-seekers package output/react/ --target langchain
从 v2.x 迁移
v3.0.0 完全向后兼容。所有 v2.x 配置和命令保持不变。新功能是附加的。
链接
- 📖 完整文档
- 💻 GitHub 仓库
- 🐦 在 Twitter 上关注我们
- 💬 加入讨论
准备好将您的数据转换为 AI 知识了吗?
pip install skill-seekers
AI 系统的通用预处理器。