AI项目与工具

WebLI

WebLI-100B是由Google DeepMind推出的超大规模视觉语言数据集，包含1000亿个图像与文本配对数据，是目前最大的视觉语言数据集之一。其设计旨在提升模型对长尾概念、文化多样性和多语言内容的理解能力。数据集通过网络爬取构建，保留了丰富的语言和文化多样性，支持多模态任务如图像分类、图像描述生成和视觉问答，广泛应用于人工智能研究、工程开发及教育领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 677 浏览

通义万相AI视频

通义万相AI视频是一款基于人工智能的视频生成工具，支持文生视频和图生视频两种模式。用户可输入文字描述或上传图片生成高质量视频，支持多语言、多种艺术风格及音频生成功能，优化中式元素表现，广泛应用于影视、广告、动画设计等多个领域。

AI项目与工具 2025年06月12日 82 点赞 0 评论 677 浏览

CogSound

CogSound是一款基于AI的音效生成工具，能够为无声视频添加与内容匹配的高质量音效，涵盖多种复杂场景。该工具通过先进的音视频特征匹配技术和优化的生成算法，提升了视频的沉浸感和真实感，广泛应用于视频创作、广告制作及影视后期等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 678 浏览

SongR

SongR是一款基于AI技术的在线歌曲创作工具，支持用户输入关键词和选择音乐风格来自动生成歌词和旋律。它提供了歌词编辑、自动谱曲、AI演唱等功能，并兼容多平台，适合个人娱乐、教育学习、商业广告等多种应用场景。用户能够轻松生成高质量的歌曲，满足个性化需求。

AI项目与工具 2025年06月12日 74 点赞 0 评论 678 浏览

AI Youtube Shorts Generator

AI Youtube Shorts Generator是一款基于AI技术的开源视频编辑工具，通过自动化流程实现长视频到短视频的高效转化。它支持视频下载、音频转录、亮点提取、声源检测及格式适配等功能，广泛应用于社交媒体营销、教育培训、新闻传播等领域，为内容创作者提供便捷高效的短视频生产解决方案。

AI项目与工具 2025年06月12日 20 点赞 0 评论 678 浏览

3DTown

3DTown是由哥伦比亚大学联合Cybever AI等机构开发的AI工具，能够从单张俯视图生成高精度的3D城镇场景。它采用区域化生成和空间感知3D修复技术，将输入图像分解为重叠区域，分别生成3D内容并修复缺失结构，确保几何和纹理一致性。支持多种风格的场景生成，适用于虚拟世界构建、游戏开发、机器人模拟等领域，优于现有方法。

AI项目与工具 2025年06月11日 17 点赞 0 评论 678 浏览

Voice Design

Voice Design是一款由ElevenLabs研发的AI语音生成工具，通过描述声音特征或虚构角色来快速生成独特的人类化语音。它支持32种语言，适用于视频旁白、广告配音、播客制作、游戏开发及虚拟助手等多个场景，为内容创作者提供高效且多样化的语音解决方案。

AI项目与工具 2025年06月12日 95 点赞 0 评论 678 浏览

协和·太初

协和·太初是北京协和医院与中国科学院自动化研究所联合开发的国内首个罕见病AI大模型，基于中国人群基因数据和罕见病知识库构建。该模型采用极小样本冷启动技术，支持多轮交互问诊、辅助医生决策、病历书写与基因解读等功能，具备深度推理能力和可溯源知识库，有效抑制AI“幻觉”。通过临床使用与数据反馈形成闭环优化，持续提升诊疗能力，助力罕见病诊疗体系建设。

AI项目与工具 2025年06月12日 96 点赞 0 评论 678 浏览