人工智能

Claude 3

Claude 3是由Anthropic开发的一系列先进的人工智能模型,旨在提供强大的认知能力和处理复杂任务的能力。该模型家族包括Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,它们分别针对不同的应用场景进行了优化。Claude 3 Opus在多个基准测试中超越了GPT-4/3.5和Gemini 1.0 Ultra/Pro,展示了其在智能水平上的显著优势。该

Perception

Perception-as-Control是由阿里巴巴通义实验室开发的图像动画框架,支持对相机和物体运动的细粒度控制。它基于3D感知运动表示,结合U-Net架构的扩散模型,实现多种运动相关的视频合成任务,如运动生成、运动克隆、转移和编辑。通过三阶段训练策略,提升运动控制精度和稳定性,适用于影视、游戏、VR/AR、广告及教育等多个领域。

Sparkify

Sparkify是谷歌推出的AI动画视频生成工具,基于Gemini 2.5和Veo 2模型。用户输入问题或复杂概念后,Sparkify能在2分钟内生成直观的动画短视频,讲解知识点。其多模态处理能力结合Google Search数据,确保内容准确且与最新信息同步。适用于教育、科普和企业培训等领域,提升理解效率和传播效果。目前处于内测阶段,可通过官网加入等候列表。

Vocol.Ai语音转文本神器

Vocol.Ai语音转文本神器,一个一体化语音协作平台,它使用人工智能将语音高精度地转换为文本并分享可操作的见解。它具有多种语言转录功能。

Soundwave

Soundwave是由香港中文大学(深圳)开发的开源语音理解大模型,专注于语音与文本的智能对齐与处理。它采用对齐适配器和压缩适配器技术,提升语音特征压缩效率,支持语音翻译、语音问答、情绪识别及多模态交互等功能。适用于智能语音助手、语言学习、内容创作等多个领域,具有广泛的应用前景。

琴乐大模型

琴乐大模型是一款由腾讯AI Lab与腾讯TME天琴实验室联合开发的人工智能音乐创作工具。该工具能够根据用户输入的关键词、描述性语句或音频,生成高质量的立体声音频或多轨乐谱,并支持自动编辑功能。琴乐大模型采用先进的技术框架,包括音频文本对齐、乐谱/音频表征提取、大语言模型预测以及流匹配和声码器技术,确保生成的音乐符合音乐理论和人类审美标准。

Casibase

一个开源的AI知识库和对话系统,支持多种主流 AI 模型,具备企业级功能和多语言界面,适合企业知识管理和智能对话场景。

Dream Screen

Dream Screen 是一款基于生成式人工智能技术的视频背景生成工具,旨在帮助创作者通过简单文本输入快速生成高质量视频背景。它提供了多种风格选择,支持个性化定制,并显著简化了短视频制作流程,尤其适用于社交媒体、教育、商业广告及影视制作等领域。其核心优势在于无需专业技能即可生成专业级视觉效果,从而提升内容吸引力与观众体验。

原创猫

原创猫致力于构建人人皆可原创,人人都是创作者的经济社区。