Imagine with Meta AI Imagine with Meta AI是一个AI图片生成工具,用户只需要语言描述,就可以自动生成所描述的图片。 Ai绘画生成 2025年06月05日 12 点赞 0 评论 380 浏览
FlagEval FlagEval作为一个专业的语言模型评估平台,为用户提供了一个可靠、标准化的评测环境。通过这个平台,研究人员和开发者可以全面了解模型的性能,推动语言模型技术的不断进步和创新。 创作工具 1970年01月01日 0 点赞 0 评论 381 浏览
蓝藻AI智播 蓝藻AI智播是一款基于山海大模型和高拟人AI声音技术的自动直播系统,实现24小时不间断直播。主要功能包括全天候直播、逼真的AI主播声音、全自动化操作流程、实时互动、在线改稿、大模型接入、中控副播以及真人接管。该系统降低直播成本,提高直播效率和观众体验,适用于电商直播带货、教育培训、企业宣传、新闻播报、客户服务及虚拟展会等多个场景。 AI项目与工具 2024年10月19日 84 点赞 0 评论 381 浏览
Open Avatar Chat Open Avatar Chat是阿里开源的模块化实时数字人对话系统,支持低延迟交互与多模态输入输出。系统采用模块化架构,允许灵活配置语音识别、语言模型和语音合成等组件,兼容本地与云服务。支持2D/3D数字人渲染,适用于客户服务、教育、娱乐及企业应用等多个场景,为开发者提供高效、灵活的AI对话解决方案。 AI项目与工具 2025年06月11日 81 点赞 0 评论 381 浏览
Phantom Phantom是由字节跳动研发的视频生成框架,支持从参考图像中提取主体并生成符合文本描述的视频内容。它采用跨模态对齐技术,结合文本和图像提示,实现高质量、主体一致的视频生成。支持多主体交互、身份保留等功能,适用于虚拟试穿、数字人生成、广告制作等多种场景。模型基于文本-图像-视频三元组数据训练,具备强大的跨模态理解和生成能力。 AI项目与工具 2025年06月12日 72 点赞 0 评论 381 浏览
SongCreator SongCreator是一款基于AI技术的音乐生成工具,由清华大学深圳国际研究生院与香港中文大学等机构联合开发。它采用双序列语言模型(DSLM)和注意力掩码策略,支持歌词到歌曲、歌词到声乐、伴奏到歌曲等多种音乐生成任务,并允许用户灵活调整生成内容的声学特性。SongCreator适用于音乐制作、教育、娱乐、内容创作等多个领域,为用户提供高效便捷的音乐解决方案。 AI项目与工具 2025年06月12日 88 点赞 0 评论 381 浏览
TokenFD TokenFD是由上海交通大学与美团联合开发的细粒度图文对齐基础模型,专为文档理解任务设计。通过图像与语言Token的统一特征空间对齐,支持Token级图文交互,提升了多模态任务性能。其基于自研的TokenIT数据集进行训练,涵盖2000万张图像和18亿高质量Token-Mask对,覆盖多种文本图像类型。TokenFD可用于文档处理、图像审查、文字检索及大模型知识增强等多个领域,具有广泛的适用性和 AI项目与工具 2025年06月12日 90 点赞 0 评论 381 浏览
Ola Ola是一款由多机构联合开发的全模态语言模型,支持文本、图像、视频和音频等多种输入形式。通过渐进式模态对齐策略,逐步扩展模型的多模态理解能力,同时采用流式解码技术提升交互体验。其架构融合多种编码器与解码器,结合局部-全局注意力机制,实现高效多模态处理,在多项任务中表现优异。 AI项目与工具 2025年06月12日 98 点赞 0 评论 382 浏览