模型

ChatTTSPlus

ChatTTSPlus 是一款基于深度学习的语音合成工具,它通过 TensorRT 技术实现了显著的性能提升,同时支持语音克隆、模型压缩与加速等功能。该工具不仅适用于桌面端,还能够部署于移动设备,满足多种应用场景需求,包括有声读物制作、语言学习辅助、客户服务及娱乐等领域。 ---

DriveDreamer4D

DriveDreamer4D是一个专注于提升自动驾驶场景4D重建质量的框架,通过整合世界模型先验知识生成新的轨迹视频,同时确保时空一致性,从而增强训练数据集的多样性和真实性。它具备4D场景重建、新轨迹视频合成、时空一致性控制以及提升渲染质量等功能,广泛应用于自动驾驶系统开发、闭环仿真测试及传感器数据模拟等领域。 ---

FunGPT

FunGPT 是一款基于 InternLM2.5 大模型开发的开源工具,专注于情感互动与情绪调节。它包含“甜言蜜语模式”和“犀利怼语模式”,分别用于提升用户情绪和释放压力。项目采用轻量化模型与 AWQ 量化技术,兼顾性能与效率。适用于创意启发、娱乐互动等多种场景,适合对情感交互感兴趣的开发者和用户。

Singify

Fineshare Singify是一款在线AI歌曲翻唱生成工具,提供超过1000种声音模型,支持多种输入方式,如搜索、上传或录音,并允许用户调整音调、节奏等参数。其生成音乐免版税,适用于个人娱乐、社交媒体分享、音乐教学及广告制作等多个场景。平台界面友好,适合各类音乐创作者和爱好者使用。

ChatWise

ChatWise 是一款支持多种语言模型的 AI 聊天工具,提供多模态交互功能,支持音频、PDF、图片和文本文件处理。其桌面优化设计提升体验,数据本地存储保障隐私。内置网页搜索功能,支持连接 Notion、Google Sheets 等外部工具,适用于学习、办公、内容创作等场景。

Helix

Helix 是 Figure 公司推出的视觉-语言-动作(VLA)模型,专为人形机器人设计,支持对上半身的高精度、高频次控制,频率达 200Hz。它能基于自然语言指令执行未见过的物品操作,具备强大的泛化能力。系统采用端到端训练方式,可在低功耗设备上运行,适用于多机器人协作、家庭服务、工业自动化等多种场景,具有较高的商业化潜力。

SHMT

SHMT是一种基于自监督学习的高级化妆转移技术,由阿里巴巴达摩院与武汉理工大学联合研发。该技术无需成对训练数据,可将多种化妆风格自然迁移到目标面部图像上,通过“解耦-重建”策略和迭代双重对齐模块,实现高精度的纹理控制与对齐校正。适用于图像处理、虚拟试妆、影视设计等多个领域,具有高效、灵活、高质量的特点。

书生·万象InternVL 2.5

书生·万象InternVL 2.5是一款开源多模态大型语言模型,基于InternVL 2.0升级而来。它涵盖了从1B到78B不同规模的模型,支持多种应用场景,包括图像和视频分析、视觉问答、文档理解和信息检索等。InternVL 2.5在多模态理解基准上表现优异,性能超越部分商业模型,并通过链式思考技术提升多模态推理能力。

阿帕斯大模型

阿帕斯大模型是APUS公司推出的以人工智能技术为核心的多模态大模型,它通过提供行业定制化的AI解决方案和创意工具,致力于帮助全球用户实现更优质的移动互联网使用体验和创造个性...

ExVideo

ExVideo是一种视频合成模型后调优技术,能够生成长达128帧的连贯视频,同时保持原始模型的生成能力。该技术通过优化3D卷积、时间注意力和位置嵌入等模块,使模型能够处理更长时间跨度的内容。ExVideo的核心优势在于其高效的后调优策略,减少计算资源需求,保持视频质量,适用于计算资源有限的情况。