模型 - 智狐AI导航

Llama 3

Llama 3是Meta公司开发的一款最新大型语言模型，提供了8B和70B两种参数规模的模型。它通过增加参数规模、扩大训练数据集、优化模型架构和增强安全性等功能，显著提升了自然语言处理能力，适用于编程、问题解决、翻译和对话生成等多种应用场景。Llama 3在多个基准测试中表现出色，并且通过指令微调进一步增强了特定任务的表现。

AI项目与工具 2025年06月12日 40 点赞 0 评论 636 浏览

CosyVoice 2.0

CosyVoice 2.0是一款基于深度学习的语音生成大模型，通过有限标量量化技术和新型架构设计，在发音准确性、音色一致性和韵律表达方面表现出色。其支持流式推理，延迟低至150ms，广泛应用于智能助手、有声读物、视频配音及语言学习等领域，同时具备多语言支持和情感控制等功能。

AI项目与工具 2025年06月12日 10 点赞 0 评论 636 浏览

Seaweed

Seaweed-7B 是一款由字节跳动开发的视频生成模型，拥有约 70 亿参数，支持从文本、图像或音频生成高质量视频。具备文本到视频、图像到视频、音频驱动生成、长镜头、连贯叙事、实时生成等功能，适用于内容创作、教育、广告等多个领域。采用变分自编码器和扩散变换器技术，结合多阶段训练与优化策略，提升生成效率与质量，兼顾性能与成本效益。

AI项目与工具 2025年06月11日 80 点赞 0 评论 636 浏览

Project DIGITS

Project DIGITS 是 NVIDIA 推出的高性能 AI 计算设备，基于 Grace Blackwell 架构，配备 GB10 Superchip，提供高达 1 万万亿次的 AI 计算能力，支持运行 2000 亿参数的大模型。其具备 128GB 统一内存和 4TB NVMe 存储，支持本地开发与云端部署，适配多种 AI 应用场景，如研究、数据分析、教育及医疗等。

AI项目与工具 2025年06月12日 52 点赞 0 评论 635 浏览

Windows AI Foundry

Windows AI Foundry 是微软推出的全新 AI 开发平台，提供从模型选择、优化、微调到部署的全生命周期支持。平台整合 Windows ML，支持在多种硬件上高效部署模型，并基于 Foundry Local 提供优化后的开源模型库。同时，提供即用型 AI API 和 LoRA 技术，帮助开发者快速集成和微调模型，提升开发效率与灵活性。

AI项目与工具 2025年06月11日 11 点赞 0 评论 635 浏览

Seed Music

一个强大的音乐生成工具，它通过先进的技术手段，如自回归模型和扩散模型，为用户提供了从音乐创作到编辑再到声音转换的全方位服务。这套系统不仅能够生成高质量的音乐作品，还能...

创作工具 2026年06月14日 0 点赞 0 评论 635 浏览

StableCode

StableCode，一个用于代码生成的大语言模型。StableCode 基于 GPT-NeoX 构建，该模型通过指令模型和具体应用示例进行改进，用于解决复杂的编程任务。

Ai编程建站 2025年06月05日 12 点赞 0 评论 635 浏览

Boximator

Boximator是一种视频合成技术，通过引入硬框和软框实现对视频中对象的位置、形状或运动路径的精细控制。它基于视频扩散模型，通过多阶段训练和自跟踪技术，确保视频合成过程中的高质量和逼真度。应用场景包括电影和电视制作、游戏开发以及VR和AR内容创作。

AI项目与工具 2024年02月20日 89 点赞 0 评论 635 浏览

neural frames

Neural Frames 是一款基于人工智能的文本转视频工具，能够将文本描述转换为动态视频内容，支持多种神经网络模型的选择与自定义训练。它具备音频反应动画、帧级编辑控制和高分辨率输出等功能，适用于音乐视频制作、数字艺术创作、广告设计、教育视频开发等多个领域，为创意工作者提供高效且灵活的解决方案。

AI项目与工具 2025年06月12日 33 点赞 0 评论 635 浏览

混元DiT（Hunyuan-DiT）是腾讯混元团队开源的高性能文本到图像的扩散Transformer模型，具备细粒度的中英文理解能力，能够生成多分辨率的高质量图像。该模型结合了双语CLIP和多语言T5编码器，通过精心设计的数据管道进行训练和优化。混元DiT的主要功能包括双语文本到图像生成、细粒度中文元素理解、长文本处理能力、多尺寸图像生成、多轮对话和上下文理解、高一致性和艺术性。此外，混元DiT在

AI项目与工具 2024年01月01日 64 点赞 0 评论 634 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期