工具描述 | 链接 |
---|---|
FlexFlow:模型部署推理框架 | https://github.com/flexflow/FlexFlow |
Medusa:针对采样解码的推理加速框架,可以和其他策略结合 | https://github.com/FasterDecoding/Medusa |
FlexGen: LLM推理 CPU Offload计算架构 | https://github.com/FMInference/FlexGen |
VLLM:超高速推理框架Vicuna,Arena背后的无名英雄,比HF快24倍,支持很多基座模型 | https://github.com/vllm-project/vllm |
Streamingllm: 新注意力池Attention方案,无需微调拓展模型推理长度,同时为推理提速 | https://github.com/mit-han-lab/streaming-llm |
llama2.c: llama2 纯C语言的推理框架 | https://github.com/karpathy/llama2.c |
Guidance: 大模型推理控制框架,适配各类interleave生成 | https://github.com/guidance-ai/guidance |
SGLang: prompt cache的告诉推理框架 | https://github.com/sgl-project/sglang |
应用 | 链接 |
---|---|
Wordware.ai: 新的flow构建交互形式,像notion一样的magic命令行形式 | https://www.wordware.ai/?utm_source=toolify |
Coze:免费 | https://www.coze.com/ |
Dify | https://dify.ai/zh |
Anakin | https://app.anakin.ai/discover |
FLowise | https://github.com/FlowiseAI/Flowise/blob/main/README-ZH.md |
Microsoft Power Automate | https://www.microsoft.com/zh-cn/power-platform/products/power-automate |
Mind Studio:有限使用 | https://youai.ai/ |
QuestFlow:付费 | https://www.questflow.ai/ |
WordWare.ai: | https://www.wordware.ai/?ref=aihub.cn |
Zion:低代码平台也入局了 | https://zion.functorz.com/userCenter/personal |
TBOX:阿里版的Coze | https://tbox.alipay.com/pro-about |
工具 | 描述 |
---|---|
Alexandria | 从Arix论文开始把整个互联网变成向量索引,可以免费下载 |
RapidAPI | 统一这个世界的所有API,最大API Hub,有调用成功率,latency等,是真爱! |
Composio | 可以和langchain,crewAI等进行集成的工具API |
PyTesseract | OCR解析服务 |
EasyOCR | 确实使用很友好的OCR服务 |
surya | OCR服务 |
Vary | 旷视多模态大模型pdf直接转Markdown |
LLamaParse | LLamaIndex提供的PDF解析服务,每天免费1000篇 |
Jina-Cobert | Jian AI开源中英德,8192 Token长文本Embedding |
BGE-M3 | 智源开源多语言,稀疏+稠密表征,8192 Token长文本Embedding |
BCE | 网易开源更适配RAG任务的Embedding模型 |
PreFLMR-VIT-G | 剑桥开源多模态Retriever |
openparse | 文本解析分块开源服务,先分析文档的视觉布局再进行切分 |
layout-parser | 准确度较高的开源OCR文档布局识别 |
AdvancedLiterateMachinery | 阿里OCR团队的文档解析和图片理解 |
ragflow-deepdoc | ragflow提供的文档识别和解析能力 |
FireCrawl | 爬取url并生成markdown的神器 |
Jina-Reader | 把网页转换成模型可读的格式 |
spRAG | 注入上下文表征,和自动组合上下文提高完整性 |
knowledge-graph | 自动知识图谱构建工具 |
Marker-API | PDF转Markdwon服务 |
MinerU | 文档识别,加入了Layout识别,Reading Order排序,公式识别,OCR文字识别的pipeline |
InstaGraph | InstaGraph: 把内容直接转换成图谱 |
https://github.com/microsoft/markitdown | 微软开源的多格式转换markdown |
- Weavel APE
- DSPY:类比Pydantic的标准化prompt和针对few-shot选择的调优
- PromptPerfect:提供多种模态,多模型的prompt一键优化插件
- LangGPT: 结构化Prompt编写模版