工具

Text

将文本转换成歌曲的工具。它使用自然语言处理将文本输入转换为音频组合。该工具允许用户从各种音乐风格和乐器中进行选择,以及调整节奏、键和动态等参数。生成的音轨可以导出为高...

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架,通过生成高质量事故视频并结合自然语言描述与推理,提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强,支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT,AVD2在多项评估中表现优异,为自动驾驶安全提供了重要技术支撑。

TTS-vue

TTS-Vue是一个开源的桌面应用程序,它利用了微软的语音合成技术,为用户提供了一个简单易用的文本到语音转换工具。

NVIDIA

NVIDIA-Ingest 是一款由英伟达开发的开源微服务工具,专为解析非结构化企业文档设计。支持多种文档格式,具备多方法提取、内容分类、并行处理及预后处理功能,结合 GPU 加速技术提升处理效率。适用于企业内容管理、智能客服、法律合规、金融分析和医疗健康等多个领域,是大规模文档处理与生成式 AI 应用的理想选择。

PhotoDoodle

PhotoDoodle是一种基于少量样本学习的艺术化图像编辑框架,能够精准复现艺术家风格并应用于照片涂鸦。它采用两阶段训练策略,结合位置编码重用和无噪声条件范式,确保生成效果与背景一致。支持装饰元素添加、背景保留、指令驱动编辑等功能,并通过低秩适应技术实现高效风格定制。项目提供高质量数据集和开源资源,适用于数字艺术创作、商业设计、社交媒体等多个场景。

Docwelo

Docwelo 是一款面向自由职业者和中小企业用户的 AI 文档生成工具,可快速生成法律合同、业务提案等专业文档。平台具备银行级安全保护,支持多人实时协作,并提供可定制的工作流程,提升文档创建效率与准确性。

Plazmapunk

PlazmaPunk 是一个旨在帮助用户轻松创建定制化的音乐生成视频的ai工具。用户通过PlazmaPunk 上传自己的音乐文件,并根据用户选择的风格自动生成定制的视频内容。

VMEG

VMEG是一个利用人工智能技术来制作视频的平台,它能够将库存和创意迅速转化为生动、动态和多样化的短视频,用于品牌、产品等的营销。

Bizway

Bizway是一款AI驱动的商业规划工具,主要功能包括生成个性化商业路线图、提供AI辅助工具支持、任务管理、实时计划优化、KPI跟踪及定制化AI助手创建。它适用于初创企业筹备、业务拓展规划、学生教育、自由职业者转型及产品开发等多个场景,帮助用户提升效率并确保计划的灵活性与实效性。