AI项目与工具

FineWeb 2

FineWeb 2是一个涵盖超过1000种语言的多语言预训练数据集,通过语言识别、去重、内容过滤及PII匿名化处理生成。它支持多种NLP任务,如机器翻译和文本分类,旨在增强多语言模型的性能与普适性,并为研究者提供技术验证的工具与资源。

TPO

TPO(Test-Time Preference Optimization)是一种在推理阶段优化语言模型输出的框架,通过将奖励模型反馈转化为文本形式,实现对模型输出的动态调整。该方法无需更新模型参数,即可提升模型在多个基准测试中的性能,尤其在指令遵循、偏好对齐、安全性和数学推理等方面效果显著。TPO具备高效、轻量、可扩展的特点,适用于多种实际应用场景。

Macaly

Macaly是一款创新的无代码应用开发工具,通过自然语言处理技术,让用户能够将想法转化为可运行的应用程序。用户可通过文字描述或语音指令参与应用创建和修改,并实时看到视觉效果反馈,提升开发效率和协作体验。Macaly与GitHub深度集成,支持代码管理和协作,适用于个人创业者、小型团队、市场营销人员和企业内部项目,支持多环境部署,增强现有项目或从零开始构建。

Recap

Recap是一款基于大型语言模型的智能工具,支持文本、网页、PDF和视频等内容的快速总结与分析,提供分段摘要、可视化图表及多语言支持。适用于学术研究、教学、市场分析、内容创作和知识管理等多个场景,提升信息处理效率与理解深度。

LaWGPT

LaWGPT 是南京大学研发的中文法律大语言模型,基于 LLaMA 进行二次预训练,融合大量法律知识,支持法律咨询、文书生成、司法考试辅助等功能。模型通过法律词表扩展、大规模语料训练及指令微调提升专业性,适用于法律研究、案件分析及政策研究等场景,助力法律行业智能化发展。

Talker

Talker-Reasoner是一种结合了直觉与逻辑推理能力的双模块AI代理架构,由谷歌DeepMind研发。它通过Talker模块快速生成自然语言回应,以及Reasoner模块执行复杂的逻辑推理和规划,实现了高效的任务处理和自然的人机交互。该架构支持多步推理、信念状态管理及上下文感知,适用于客户服务、健康管理、教育辅导等多个领域。

Arctic

Arctic是一款由云计算公司Snowflake的AI研究团队开发的高效且开源的企业级大型语言模型,拥有480亿参数。该模型采用混合专家模型(MoE)架构,结合了密集变换器(Dense Transformer)和128个专家的特点。Arctic在成本效益、训练效率和推理效率方面具有显著优势,特别适用于企业任务,例如SQL生成、编程和指令遵循。模型基于Apache 2.0许可发布,用户可以自由使用和

Modify Video

Modify Video 是 Luma AI 推出的创新 AI 视频编辑工具,支持在保留视频原始动作和运镜的基础上,对环境、风格和单个元素进行自由修改。它具备动捕与操纵、风格迁移、高保真创意控制等功能,提供多种输出变体和预设模式,提升视频创作的灵活性和效率。适用于影视制作、广告创意、动画设计等领域。

FunASR

FunASR是一个由阿里巴巴达摩院开源的多功能语音识别工具包,涵盖语音识别(ASR)、语音活动检测(VAD)、标点恢复、说话人验证及分离等功能。它支持工业级模型的训练与微调,并提供预训练模型和易用接口,便于快速部署。新增的Whisper-large-v3-turbo模型进一步提升了其性能,广泛应用于智能助手、会议记录、客服系统和语音搜索等领域。

StealthGPT

StealthGPT是一款生成“不可检测”AI文本的工具,主要面向学生和内容创作者。它通过“人类化”处理,使AI生成的内容更接近人类写作,从而绕过AI检测工具。支持多语言写作、自动化引用、格式化、图片转答案、SEO写作以及PDF辅助阅读等功能。用户可选择不同版本以满足学习、创作和商业需求。