AI项目与工具

Vace AI

Vace AI 是一款集成视频生成与编辑功能的 AI 工具,支持文本到视频、参考图像生成视频等功能,并提供风格转换、主体移除、画面扩展等编辑选项。基于先进模型技术,可精准保留关键视觉元素,生成高质量视频,适用于短视频制作、创意内容生成及广告设计等多种场景。

协和·太初

协和·太初是北京协和医院与中国科学院自动化研究所联合开发的国内首个罕见病AI大模型,基于中国人群基因数据和罕见病知识库构建。该模型采用极小样本冷启动技术,支持多轮交互问诊、辅助医生决策、病历书写与基因解读等功能,具备深度推理能力和可溯源知识库,有效抑制AI“幻觉”。通过临床使用与数据反馈形成闭环优化,持续提升诊疗能力,助力罕见病诊疗体系建设。

DiffEditor

DiffEditor是由北京大学深圳研究生院与腾讯PCG联合研发的图像编辑工具,基于扩散模型,结合图像与文本提示,支持细粒度对象移动、尺寸调整、内容拖动及跨图像编辑。采用区域随机微分方程(Regional SDE)和时间旅行策略,提升编辑准确性和灵活性。无需额外训练即可实现高效图像处理,适用于创意设计、人像修复和风景优化等场景。

Entie

Entie 是一款基于AI技术的情侣关系管理工具,提供情感追踪、健康评分、协议制定及活动建议等功能,帮助情侣更好地理解彼此需求,提升沟通质量。其核心优势在于科学分析与个性化建议,适用于不同阶段的情侣关系,助力建立更和谐、稳定的情感连接。

Relay.app

Relay.app是一个强大的自动化平台,支持用户创建AI驱动的智能工作流,连接100多个常用应用程序。它提供直观的界面和“人在回路”功能,使非技术人员也能构建复杂的自动化流程。内置AI功能如内容总结、文本翻译和数据提取,以及自定义AI模型调用,满足多样化业务需求,提高工作效率和团队协作的流畅性。

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足

Parakeet TDT 0.6B

Parakeet TDT 0.6B 是一款由英伟达开发的开源自动语音识别(ASR)模型,采用 FastConformer 和 TDT 架构,具备高速转录、高精度识别、歌词转录、文本格式化等功能。模型在 Hugging Face Open ASR Leaderboard 中表现优异,实时因子高达 3386,适用于会议记录、法律医疗、字幕生成及音乐索引等多种场景。

云图AI网

云图AI网是一款专为室内外建筑设计师打造的AI绘图工具,支持上传多种设计图纸并快速生成效果图。主要功能包括AI创作、彩平图生成、局部重绘,同时覆盖室内设计、建筑规划、园林景观及展厅展览等领域,帮助设计师节省时间、降低成本并提升工作效率。

Act

Act-One是一款由Runway开发的AI生成式角色表演工具,能够基于简单视频输入生成逼真的虚拟角色动画。它简化了面部动画制作流程,无需复杂设备,仅需单一摄像头即可完成,同时支持多样化角色表现和多轮对话场景生成,广泛应用于电影、动画、角色设计及叙事内容创作等领域。

Unique3D

Unique3D是一款由清华大学团队开发的开源框架,专注于单张图像到3D模型的转换。它利用多视图扩散模型和法线扩散模型,结合多级上采样策略和ISOMER算法,能够在短时间内生成高保真度且纹理丰富的3D网格模型。Unique3D能够从单个2D图像生成3D网格模型、多个正交视图图像和法线贴图,并通过多级上采样过程提高图像分辨率,最终实现颜色和几何细节的高度整合。