v3.0.0 发布 langchain llamaindex cursor claude

Skill Seekers v3.0.0:通用智能平台

将文档、GitHub 仓库、PDF 和代码库转换为适用于任何 AI 系统的结构化知识。16 种输出格式。1,852 个测试。一个工具支持 LangChain、LlamaIndex、Cursor、Claude 等。

Skill Seekers 团队

Skill Seekers v3.0.0:通用智能平台

太长不看

  • 🚀 16 种输出格式(v2.x 只有 4 种)
  • 🛠️ 26 个 MCP 工具(之前是 9 个)
  • 1,852 个测试通过(之前是 700+)
  • ☁️ 云存储支持(S3、GCS、Azure)
  • 🔄 CI/CD 就绪(GitHub Action + Docker)
  • 🎮 Godot 游戏引擎支持,带信号流分析
  • 🌐 27+ 编程语言(新增 7 种)
  • 📚 4 种输入源:文档、GitHub 仓库、PDF、本地代码库
pip install skill-seekers
skill-seekers scrape --config react.json

我们要解决的问题

每个 AI 项目都需要数据预处理:

  • RAG 管道:“抓取这些文档/仓库/PDF,分块,嵌入…”
  • AI 编码工具:“我希望 Cursor 了解这个框架/API…”
  • Claude 技能:“将这个代码库转换为技能”

**70% 的 RAG 开发时间花在数据预处理上。**每个人都在重复构建相同的基础设施。停止重复造轮子。开始使用。

解决方案:通用预处理器

Skill Seekers v3.0.0 将文档、GitHub 仓库、PDF 和本地代码库转换为适用于任何 AI 系统的结构化知识:

用于 RAG 管道

# 从文档
skill-seekers scrape --format langchain --config react.json

# 从 GitHub 仓库
skill-seekers scrape --format langchain --github https://github.com/user/repo

# 从 PDF
skill-seekers scrape --format langchain --pdf ./manual.pdf

# 从本地代码库
skill-seekers analyze --directory ./my-project --format langchain

用于 AI 编码助手

# 适用于任何源——文档、仓库或代码库
skill-seekers scrape --target claude --config react.json
cp output/react-claude/.cursorrules ./

# Windsurf、Cline、Continue.dev - 同样流程

用于 Claude AI

skill-seekers install --config react.json
# 自动获取、抓取、增强、打包、上传

v3.0.0 新增功能

4 种输入源

命令用例
文档scrape --config框架文档、API、指南
GitHub 仓库scrape --github开源库、工具
PDF 文件scrape --pdf手册、研究论文、书籍
本地代码库analyze --directory您自己的项目、游戏引擎

16 个平台适配器

类别平台命令
RAG/向量LangChain、LlamaIndex、Chroma、FAISS、Haystack、Qdrant、Weaviate--format <名称>
AI 平台Claude、Gemini、OpenAI--target <名称>
AI 编码Cursor、Windsurf、Cline、Continue.dev--target claude
通用Markdown--target markdown

26 个 MCP 工具

您的 AI 代理现在可以准备自己的知识:

  • 配置工具(3 个):generate_config、list_configs、validate_config
  • 抓取工具(8 个):estimate_pages、scrape_docs、scrape_github、scrape_pdf、scrape_codebase、detect_patterns、extract_test_examples、build_how_to_guides
  • 打包工具(4 个):package_skill、upload_skill、enhance_skill、install_skill
  • 源工具(5 个):fetch_config、submit_config、add/remove_config_source、list_config_sources
  • 拆分工具(2 个):split_config、generate_router
  • 向量数据库工具(4 个):export_to_weaviate、export_to_chroma、export_to_faiss、export_to_qdrant

云存储

直接将技能上传到云存储:

# AWS S3
skill-seekers cloud upload output/react/ --provider s3 --bucket my-bucket

# Google Cloud Storage
skill-seekers cloud upload output/react/ --provider gcs --bucket my-bucket

# Azure Blob Storage
skill-seekers cloud upload output/react/ --provider azure --container my-container

CI/CD 就绪

GitHub Action:

- uses: skill-seekers/action@v1
  with:
    config: configs/react.json
    format: langchain

Docker:

docker run -v $(pwd):/data skill-seekers:latest scrape --config /data/config.json

Godot 游戏引擎支持

完整的 Godot 4.x 分析,带信号流检测:

skill-seekers analyze --directory ./my-godot-game --comprehensive

检测:

  • 信号声明和连接
  • 事件模式(EventBus、Observer、事件链)
  • GDScript 测试提取(GUT、gdUnit4)

扩展语言支持

7 种新语言: Dart、Scala、SCSS/SASS、Elixir、Lua、Perl

总计:支持 27+ 编程语言

生产质量

  • 1,852 个测试,分布在 100 个测试文件中
  • 58,512 行 Python 代码
  • 80+ 个文档文件
  • 12 个示例项目,涵盖每个集成

快速开始

# 安装
pip install skill-seekers

# 创建配置
skill-seekers config --wizard

# 或使用预设
skill-seekers scrape --config configs/react.json

# 打包为您的平台
skill-seekers package output/react/ --target langchain

从 v2.x 迁移

v3.0.0 完全向后兼容。所有 v2.x 配置和命令保持不变。新功能是附加的。

链接


准备好将您的数据转换为 AI 知识了吗?

pip install skill-seekers

AI 系统的通用预处理器。