ORM - 智狐AI导航

Oasis

Oasis是一款依托于AI技术的实时生成游戏，无需依赖传统游戏引擎即可实现每秒20帧的高质量交互式视频内容输出。它支持玩家自由探索开放世界，并通过动态调整机制提供个性化体验。凭借开源特性及硬件优化能力，Oasis展示了AI在内容创作领域的巨大潜力，适用于游戏、教育、虚拟旅游等多个领域。

AI项目与工具 2025年06月12日 83 点赞 0 评论 651 浏览

BitoAI

将生成代码的速度提高 10 倍

创作工具 1970年01月01日 0 点赞 0 评论 648 浏览

ConsisID

ConsisID是一款由北京大学和鹏城实验室开发的文本到视频生成工具，其核心技术在于通过频率分解保持视频中人物身份的一致性。该模型具备高质量视频生成能力、无需微调的特点以及强大的可编辑性，同时拥有优秀的泛化性能。其主要功能包括身份保持、高质量视频生成、文本驱动编辑以及跨领域人物处理，广泛应用于个性化娱乐、虚拟主播、影视制作、游戏开发及教育模拟等领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 643 浏览

腾讯混元T1

T1（Thinker）是腾讯混元推出的深度思考模型，支持逻辑推理与联网搜索，具备高速响应和长文本处理能力。采用Hybrid-Mamba-Transformer架构，提升推理效率与准确性。适用于教育、医疗、市场分析等多个领域，输出简洁、幻觉低，适合复杂指令处理和多任务场景。

AI项目与工具 2025年06月12日 68 点赞 0 评论 643 浏览

Yi

Yi-Coder是一款由零一万物开发的开源AI编程助手，支持52种主流编程语言，能够处理长达128K tokens的上下文。它在多个代码生成基准测试中表现优异，尤其在LiveCodeBench平台上的表现尤为突出。Yi-Coder在代码编辑和补全方面也有卓越的表现，适用于各种开发项目，帮助开发者提高工作效率。 ---

AI项目与工具 2025年06月12日 80 点赞 0 评论 639 浏览

Emu3

Emu3是一款由北京智源人工智能研究院开发的原生多模态世界模型，结合了多模态自回归技术和单一Transformer架构，能够在图像、视频和文本之间实现无缝转换。它不仅能够根据文本生成高质量图像，还能预测视频发展并理解图文内容，广泛应用于内容创作、广告营销、教育、娱乐等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 639 浏览

Westlake

Westlake-Omni是西湖心辰推出的一款开源中文情感端到端语音交互大模型，融合了语音识别、自然语言处理、情感理解和对话管理等功能，具备实时性和端到端交互特性。它通过深度学习技术和离散表示法，实现从语音输入到语音输出的全流程自动化，生成自然流畅的语音回应，并广泛应用于智能助手、客户服务、教育辅助、健康医疗等领域。

AI项目与工具 2025年06月12日 91 点赞 0 评论 639 浏览

Instella

Instella是AMD推出的30亿参数开源语言模型，基于自回归Transformer架构，支持4096标记序列，具备强大的自然语言理解、指令跟随和多轮对话能力。通过多阶段训练和高效优化技术，Instella在多个任务中表现优异，适用于智能客服、内容创作、教育辅导、编程辅助和企业知识管理等多个场景。AMD全面开放了模型资源，促进AI技术发展与社区合作。

AI项目与工具 2025年06月12日 79 点赞 0 评论 633 浏览

Fish Speech 1.5

Fish Speech 1.5是一款基于深度学习的文本转语音（TTS）工具，支持多语言文本输入，通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力，延迟时间短，无需依赖音素，泛化性强，且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 631 浏览

Fractal Generative Models

Fractal Generative Models 是一种基于分形架构的图像生成技术，通过递归调用“原子模块”实现逐像素生成高分辨率图像。该模型结合 Transformer 模块，采用分而治之策略，大幅提升计算效率。不仅适用于图像生成，还可扩展至分子结构、蛋白质等高维数据建模，具有广泛的应用潜力。

AI项目与工具 2025年06月12日 69 点赞 0 评论 629 浏览

ORM

首页

ORM

列表

默认

浏览次数

发布日期