AI 交互终端与成品应用

Chat UI

  • Cherry Studio - 桌面级跨平台 AI 助手,支持主流云端及本地模型。
  • Lobe Chat - 自部署聊天终端,UI 精美,支持插件与多模态。
  • Open WebUI - 功能非常完整的本地/自部署 LLM Web 界面,支持复杂的 RAG 流程。

面向人的搜索

  • Perplexity - 主流 AI 搜索产品之一,以引用和实时搜索体验见长。
  • 秘塔 AI 搜索 - 国内领先的 AI 搜索产品,提供极佳的深度调研与结构化整理体验。

通用智能体

  • OpenClaw - 开源的任务执行型 Agent,拥有独立文件系统和执行环境,可处理邮件管理、日历安排、代码编写等多类任务。
  • DeerFlow - 字节跳动开源的 super agent harness。它把 sub-agentsmemory 和 sandbox 组织在一起,再配合可扩展的 skills,让 agent 可以完成几乎任何事情。

面向 AI 的搜索

  • Exa.ai - 专为 LLM 设计的语义搜索引擎,支持语义检索与按需内容过滤。
  • Tavily - 专为 AI Agent 优化的搜索 API,提供自动聚合、去重后的总结性内容。
  • Grep - GitHub 代码搜索引擎,通过 MCP 协议让 AI 快速搜索百万个公开仓库,支持按语言、文件路径、正则表达式等条件查找代码。

深度研究 (Deep Research)

  • GPT-Researcher - 目前最成熟的开源深度科研 Agent,能自动抓取 20+ 来源并生成详尽的调研报告。
  • Open Deep Research - LangChain 团队出品的开源复刻版,代码结构清晰,非常适合开发者进行二次开发。

行业垂直应用

  • PaddleOCR - 百度飞桨出品的开源 OCR 系统,支持多语言识别与排版分析。
  • AI Hedge Fund - 利用 Agent 尝试量化交易与选股决策。
  • OpenBB - 用于金融分析的开源终端,深度集成 AI 辅助。

AI 编程助手

AI 原生 IDE

  • Cursor - 目前最主流的 AI 原生 IDE 之一,深度集成代码编辑与全局预测。
  • Windsurf - Codeium 出品,以“Flow”模式著称的 AI 编辑器。
  • Trae - 字节跳动出品的 AI IDE,支持从自然语言直接生成项目。
  • Zed - 追求性能极致的编辑器,原生集成主流 LLM。
  • Antigravity - 谷歌开发的高级 Agent 编码助手。

IDE 插件

  • GitHub Copilot - 编程 AI 鼻祖,集成于 VS Code, JetBrains 等环境。
  • Cline - 开源 AI Agent 插件,赋予 IDE 读写文件与执行命令的能力。
  • Continue - 开源插件,支持自定义本地模型作为辅助引擎。

命令行工具 (CLI)

  • Claude Code - Anthropic 官方 CLI 工具,支持复杂的系统级自动化。
  • OpenAI Codex CLI - OpenAI 官方命令行 AI 编程助手,支持代码编辑、补丁生成、多模态推理,在沙箱环境中安全运行。
  • Gemini CLI - 官方命令行工具,快速在终端调用 Gemini 模型。
  • OpenCode -开源AI编码智能体,TUI美观。

Agent 与应用开发平台

低代码/可视化平台

  • Dify - 企业级 LLM 应用开发平台,提供完整的工作流管理。
  • Coze - 字节跳动出品,生态极其丰富的 Agent 一站式配置平台。

开发者 SDK 与框架

  • LangChain - 全球最流行的 LLM 应用开发框架。
  • LangGraph - 专注于构建循环图结构的复杂多智能体系统。
  • PydanticAI - Pydantic 团队推出的新一代框架,主打类型安全与严谨的开发体验。
  • Vercel AI SDK - Next.js 团队出品的 TypeScript 工具包,提供统一的 API 接入多家模型提供商,内置 Agent 支持、流式响应,以及 AI Elements UI 组件库,与 React/Next.js 生态深度集成。
  • CopilotKit - 在 React 应用中快速集成 AI 辅助功能的组件库。

浏览器自动化

  • Browser-use - 当前最有影响力的浏览器 Agent 项目之一,让 AI 能够像真人一样操作浏览器完成复杂任务。
  • Agent-Browser - Vercel Labs 出品的 AI 专用浏览器自动化 CLI 工具,基于 Rust 开发,速度提升 93%,通过语义化快照节省 93% Token,专为 AI Agent 设计。

知识管理与数据增强

网页解析与爬虫

  • Crawl4AI - 专为 LLM 设计的高性能爬虫,能将复杂网页完美转化为 Markdown 格式。
  • Firecrawl - 极其强大的网页解析工具,能够处理反爬并直接输出结构化数据。

RAG 系统

  • AnythingLLM - 零配置的 RAG 解决方案,支持多模态知识库。
  • RAGFlow - 基于深度解析的 RAG 引擎,擅长处理复杂文档。

记忆

  • Mem0 - 为 AI 提供个性化记忆层,实现长期的用户状态追踪。

本地模型、部署与基建

本地模型与推理工具

  • Ollama - 本地运行大模型最主流的工具之一,极简的命令行操作与丰富的模型库。
  • LM Studio - 图形化本地模型管理工具,支持搜索、下载并运行主流开源大模型。
  • vLLM - 性能极强的本地及服务器推理后端,适合高并发场景。

模型网关

  • LiteLLM - 最流行的统一 LLM API 网关/代理层之一,支持 100+ 模型提供商的统一接口调用。
  • OpenRouter - 统一的多模型 API 入口,提供一站式访问主流 LLM 的能力,按实际使用计费。
  • New API - 模型中转系统,支持多渠道聚合与 API 管理。

多模态内容创作

图像生成

  • Midjourney - 在商业艺术创作场景表现非常强,提供极高的艺术表现力和细节控制。
  • FLUX.1 - 当前最有代表性的开源图像生成模型之一,支持极高的写实度,且能精准生成图片内的文字。
  • Stable Diffusion - 开源生态的基石,拥有极强的 ControlNet 精确控制能力。
  • ComfyUI - 当前最主流的节点式图像生成工作流工具,几乎已成为高级用户使用 FLUX / Stable Diffusion 生态的默认方式。

视频创作

  • Sora - OpenAI 出品的视频生成模型,以惊人的物理规律模拟和长视频一致性著称。
  • Veo - Google DeepMind 推出的视频生成模型,在 1080p 分辨率及多种电影级风格场景表现非常强。
  • SeedDance - 字节跳动出品的多模态视频生成模型,支持文生视频、图生视频,具备多镜头叙事能力和影视级画质,支持音视频联合生成与精准编辑。

语音与音频

  • ElevenLabs - 在 AI 配音平台领域表现非常强,支持极具情感的语音克隆和多语言合成。
  • Suno / Udio - 音乐生成领域最有代表性的服务之一,支持从文本一键生成完整、高品质的乐曲。
  • GPT-SoVITS - 在开源语音克隆方面表现非常强,支持本地部署与快速音色复刻。

学习资源与集锦

教程与收录

提示词工程 (Prompting)