AI项目与工具

可栗口语

可栗口语是一款基于AI技术的英语口语学习应用,提供一对一虚拟外教对话、实时语法和发音纠正等功能。它涵盖日常生活、职场、雅思备考等多个场景,支持个性化课程定制和用户数据优化,旨在全面提升用户的英语听说能力。

Oumi

Oumi 是一个开源 AI 平台,支持从数据准备到模型部署的全流程开发。它提供零样板代码体验,支持多种训练方法和多模态模型,适用于自动驾驶、人机交互、学术研究等多个场景。平台具备高效的分布式训练能力和灵活的部署选项,适合企业和研究机构使用。

LowCodeEngine

LowCodeEngine是一款由阿里巴巴开源的低代码开发框架,专注于通过拖拽和配置简化复杂系统的构建过程。其核心功能包括组件化开发、数据绑定、模板引擎及物料体系支持,同时具备强大的扩展能力和基于TypeScript的开发环境。该工具适用于企业内部系统、业务流程自动化、数据可视化、电子商务平台及移动应用开发等多个场景,致力于提升开发效率和质量。

potpie.ai

potpie.ai 是一个基于AI技术的开源平台,通过构建代码知识图谱,实现对代码库的深度理解和自动化处理。它提供多种预设代理,支持自定义开发,适用于不同规模和语言的代码库。平台具备智能交互、无缝集成和灵活适应等特点,广泛应用于代码分析、测试生成、调试优化和团队协作等场景。

PaperOMG

PaperOMG是一款集论文写作、查重、降重和PPT制作于一体的AI辅助工具,支持开题报告、文献综述和初稿撰写等功能。其查重系统基于指纹比对技术,覆盖大量学术资源,准确率高。平台还提供多种查重版本及降重策略,帮助用户提升论文原创性,保障学术规范。

Mochi 1

Mochi 1 是一款基于开源架构的 AI 视频生成工具,具有高保真度和强大的提示遵循能力。它采用 Genmo 自研的非对称扩散变压器(AsymmDiT)架构,结合实时视频生成技术和流式架构,能够高效生成高质量的视频内容。Mochi 1 支持多种应用场景,包括视频内容创作、教育、娱乐、广告和社交媒体等,适用于个人和企业用户。

HiveChat

HiveChat 是一款面向中小团队的 AI 聊天工具,支持多款主流 AI 模型,具备文本交互、图像理解、LaTeX/Markdown 渲染等功能。系统基于 React 构建,支持多种部署方式,适用于企业沟通、学术研究、内容创作等场景,提供高效、便捷的智能协作体验。

MimicTalk

MimicTalk是一款利用NeRF技术快速生成个性化3D说话人脸模型的工具,其核心功能包括15分钟内完成新身份训练、高质量视频生成、增强的表现力以及上下文学习能力。该工具通过混合适应流程、上下文风格化音频到运动模型等技术,实现了高效的数据样本利用和训练效率提升,适用于虚拟主播、远程协作、VR/AR等领域。

ViewExtrapolator

ViewExtrapolator是一种基于稳定视频扩散(SVD)的新视角外推方法,能够生成超出训练视图范围的新视角图像,特别适用于提升3D渲染质量和视觉真实性。该工具通过优化SVD的去噪过程,减少了伪影问题,同时支持多视图一致性生成,无需额外微调即可实现高效的数据和计算性能,广泛适用于虚拟现实、3D内容创作及文物保护等多个领域。

FLOAT

FLOAT是一款基于音频驱动的虚拟人像生成模型,利用运动潜在空间和流匹配技术,实现时间一致性视频生成。它支持情感增强,生成自然且富有表现力的虚拟人物,广泛应用于虚拟主播、视频会议、社交媒体、游戏以及电影制作等多个领域,同时具备高效的采样和生成能力。