Crawl4LLM Crawl4LLM是由清华与CMU联合开发的智能爬虫系统,通过评估网页对大语言模型预训练的价值,提升数据获取效率。支持多种爬取模式,具备状态保存、数据可视化功能,并与DCLM框架兼容。采用多维度评分机制优化爬取策略,减少低价值内容抓取,降低对网站负担,适用于LLM预训练、数据集构建等场景。 AI项目与工具 2025年06月12日 55 点赞 0 评论 323 浏览
Reworkd Reworkd是一款基于人工智能的自动化网络数据提取工具,主要功能包括自动化抓取代码生成、动态网站适应、全流程自动化操作及实时数据故障修正。它无需编程知识即可使用,并支持多种应用场景,如市场研究、金融分析、房地产数据收集、学术研究、客户服务自动化以及供应链管理,为企业提供高效、准确的数据获取方案。 AI项目与工具 2025年06月12日 33 点赞 0 评论 322 浏览
Lucidchart 由Lucid Software开发的在线图表制作和可视化工具,支持创建流程图、组织结构图、思维导图、UML、ERD、BPMN等多种图表类型,并提供实时协作功能。 教育学习 2025年06月05日 65 点赞 0 评论 321 浏览
SPDL SPDL(Scalable and Performant Data Loading)是一款由Meta AI开发的开源工具,专注于提高AI模型训练效率。它通过多线程技术和异步事件循环实现高吞吐量数据加载,降低资源消耗,支持分布式系统和主流AI框架PyTorch,适用于大规模数据集及复杂任务。其主要特点包括高吞吐量、低资源占用、框架无关性、性能监控与调优能力以及分布式系统支持。 AI项目与工具 2025年06月12日 25 点赞 0 评论 321 浏览
Saner.AI Saner.AI是一款以人工智能驱动的知识管理工具,旨在提高个人和团队的工作效率。其主要功能包括即时笔记记录、智能信息导入、专注模式、多视角信息查找、PDF与笔记摘要生成,以及标签推荐和相似笔记连接等。通过这些功能,Saner.AI能够帮助用户高效整理信息、激发创意,并提升专注力。它适用于多种场景,包括个人知识管理、团队协作、学习辅助、项目管理和日常任务规划,同时注重数据安全与隐私保护。 AI项目与工具 2025年06月12日 19 点赞 0 评论 320 浏览
TinyTroupe TinyTroupe是一款基于大型语言模型的Python库,专注于生成逼真的虚拟人物行为。它通过构建虚拟角色(TinyPerson)与环境(TinyWorld),实现个性化、高自由度的行为模拟,并支持多智能体间的互动。该工具适用于市场研究、产品测试、用户体验优化等多个领域,为企业提供洞察力与决策支持。 --- AI项目与工具 2025年06月12日 69 点赞 0 评论 319 浏览
TeleChat2 TeleChat2-115B是一款由中国电信人工智能研究院开发的大型语言模型,具备强大的文本生成能力。它支持多语言处理,包括中文和英文,并且能够高效执行多种任务,如文本生成、代码编写、数据分析和语言翻译等。此外,TeleChat2-115B通过先进的架构设计,如Decoder-only结构和Rotary Embedding位置编码方法,提升了模型性能与稳定性。该模型适用于智能客服、内容创作、教育辅 AI项目与工具 2025年06月12日 23 点赞 0 评论 319 浏览