LLM Engineer Toolkit是什么?

LLM Engineer Toolkit是一个精心整理的LLM工具库,它将120多个与LLM相关的库按功能和用途分类,涵盖从训练微调、应用开发、推理服务到安全评估等LLM开发全流程所需的工具。

LLM Engineer Toolkit工具分类

1. LLM训练和微调

  • unsloth:快速微调LLM,减少内存占用。

  • PEFT:参数高效微调库。

  • TRL:通过强化学习训练Transformer语言模型。

  • DeepSpeed:分布式训练和推理优化库。

2. LLM应用开发

  • LangChain:开发基于LLM的应用。

  • Llama Index:为LLM应用提供数据框架。

  • Haystack:端到端LLM框架,支持与Transformer模型和向量搜索集成。

3. LLM推理

  • vLLM:高吞吐量、内存高效的推理引擎。

  • LightLLM:轻量级、可扩展的推理框架。

  • TensorRT-LLM:Nvidia框架,用于优化LLM推理。

4. LLM服务

  • Langcorn:自动将LangChain应用部署为FastAPI服务。

  • LitServe:支持批量、流式传输和GPU自动扩展的快速服务引擎。

5. LLM数据提取

  • Crawl4AI:开源的LLM友好型网络爬虫。

  • Docling:文档解析工具。

  • PyMuPDF4LLM:用于提取PDF内容的工具。

6. LLM数据生成

  • DataDreamer:合成数据生成库。

  • fabricator:灵活的合成数据生成框架。

7. LLM安全与监控

  • LLM Guard:LLM交互的安全工具。

  • Weights & Biases:跟踪LLM性能。

  • Helicone:开源的LLM可观测性平台。

8. LLM评估

  • Ragas:LLM应用评估工具。

  • LangTest:提供多种测试类型,评估LLM的准确性、偏见和鲁棒性。

9. LLM嵌入模型

  • Sentence-Transformers:最先进的文本嵌入模型。

  • Text Embedding Inference:高性能嵌入模型推理工具。

10. 其他

  • LLM Transparency Tool:分析Transformer模型内部机制的工具。

  • mergekit:合并预训练LLM的工具。

llm-engineer-toolkit工具库GitHub仓库: https://github.com/KalyanKS-NLP/llm-engineer-toolkit

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部