学习

Gemini 2.5 Pro

Gemini 2.5 Pro 是谷歌推出的高性能 AI 模型,具备深度推理能力,可在多模态输入下进行复杂任务处理。支持文本、图像、音频、视频及代码等多种输入形式,拥有 100 万 token 的上下文窗口。在推理、代码生成和多模态任务中表现优异,适用于学术研究、软件开发、创意工作和企业应用等多个领域。

叨叨

叨叨是一款融合AI与社交养成元素的多功能工具软件,用户可通过与虚拟AI伴侣互动完成记账、单词学习等任务。软件支持个性化定制AI性格,加入小剧场群聊进行社交互动,并具备高效的单词抽背与复习功能,适用于个人财务管理、学习提升及情感陪伴等场景。

izdaxAi

izdaxAi是一款由新疆碧利雅电子科技开发的多功能人工智能应用,集成智能问答、写作辅助、语言学习、绘画创作、多语言输入与翻译等功能。支持语音和文字交互,涵盖维吾尔语、汉语、英语等多种语言。提供高效的输入方式、个性化的界面设置及智能化的服务,适用于学习、创作、日常办公等多场景。

ModelScope

ModelScope被称为“魔搭社区”,是国内首个中文AI模型开源社区,由阿里巴巴通义实验室联合CCF开源发展委员会发起的模型开源社区及创新平台,旨在通过开放的社区合作,构建深度学习相关的模型开源社区,并开放给全球的开发者使用。

Enhance

Enhance-A-Video是一款由多所顶尖高校联合研发的视频生成增强算法,专注于提升AI生成视频的质量,特别是在对比度、清晰度及细节真实性方面具有显著优势。其核心技术基于时间注意力机制优化,无需额外训练即可高效提升视频效果,适用于视频创作、学术研究、在线平台等多个领域。

Gliglish

Gliglish 是一款基于 AI 技术的口语学习平台,通过语音识别和自然语言处理技术,模拟真实对话场景,帮助用户提升口语和听力能力。支持多语言学习,包括英语、中文、日语、韩语、德语、法语等,并提供即时语法和发音反馈。用户可调节对话速度,实现个性化学习。此外,Gliglish 支持多语言语音输入和输出,适合语言初学者及需要强化特定语言技能的学习者。

MotionGen

MotionGen是一款由元象科技开发的3D动作生成模型,它结合了大模型、物理仿真和强化学习算法,使得用户通过简单的文本指令就能生成逼真且流畅的3D动作。该工具简化了3D动画的制作过程,提升了创作效率。其主要功能包括文本到动作的转换、高度逼真和流畅的动作生成、个性化定制、高效的制作流程和技术融合。

百度智能云一见

百度智能云一见是一款面向视觉领域的大型模型平台,通过先进的深度学习、多模态学习及自动化机器学习技术,降低了模型生产的成本并提高了训练效率。该平台支持端到端效果调优自动化、零代码AI技能编排以及云边协同,广泛应用于工业质检、安全生产监控、餐饮连锁管理和零售分析等领域,助力企业实现智能化转型。

Reverb ASR

Reverb ASR是一款基于深度学习的开源自动语音识别与说话人分离工具,采用20万小时高质量英语语音数据训练,具备高精度语音转录能力,支持逐字稿控制及多种解码模式。其显著特点是擅长处理长时间语音内容,并在长篇幅识别任务中超越其他开源模型。Reverb ASR适用于播客、会议记录、法庭记录等多个应用场景,为用户提供灵活且高效的语音转文字解决方案。

SimpleAR

SimpleAR是一款由复旦大学与字节跳动联合研发的纯自回归图像生成模型,采用简洁架构实现高质量图像生成。其通过“预训练-有监督微调-强化学习”三阶段训练方法,提升文本跟随能力与生成效果。支持文本到图像及多模态融合生成,兼容加速技术,推理速度快。适用于创意设计、虚拟场景构建、多模态翻译、AR/VR等多个领域。