架构 - 智狐AI导航

万相首尾帧模型

万相首尾帧模型（Wan2.1-FLF2V-14B）是一款开源视频生成工具，基于DiT架构和交叉注意力机制，可根据用户提供的首帧和尾帧图像生成高质量、流畅的过渡视频。支持多种风格和特效，适用于创意视频制作、影视特效、广告营销等多个场景。模型具备细节复刻、动作自然、指令控制等功能，且提供GitHub和HuggingFace开源资源供用户使用。

AI项目与工具 2025年06月11日 100 点赞 0 评论 803 浏览

NVIDIA

NVIDIA-Ingest 是一款由英伟达开发的开源微服务工具，专为解析非结构化企业文档设计。支持多种文档格式，具备多方法提取、内容分类、并行处理及预后处理功能，结合 GPU 加速技术提升处理效率。适用于企业内容管理、智能客服、法律合规、金融分析和医疗健康等多个领域，是大规模文档处理与生成式 AI 应用的理想选择。

AI项目与工具 2025年06月12日 20 点赞 0 评论 801 浏览

Framer-成功从网站开始

设计并发布你的梦想网站

Ai绘画生成 2026年06月29日 0 点赞 0 评论 800 浏览

PsycoLLM

PsycoLLM是由合肥工业大学研发的中文心理大模型，基于高质量心理数据集训练，具备精准理解心理问题、多轮对话交互、情绪识别与支持、心理健康评估等功能。其技术融合了多步数据优化、监督微调和Transformer架构，适用于个人心理支持、心理咨询、教育及社区服务等场景，为心理健康领域提供专业、高效的技术解决方案。

AI项目与工具 2025年06月12日 48 点赞 0 评论 791 浏览

阿里云金融级实人认证

实人认证是对用户身份信息真实性核验的服务，验证用户为真人且为本人。包含证件 OCR 识别、活体检测、人脸对比等能力，广泛应用于用户注册场景。

创作工具 2026年06月29日 0 点赞 0 评论 787 浏览

EMOVA

EMOVA是一款由多所高校与企业联合研发的多模态全能型AI助手，具备处理图像、文本和语音的能力，支持情感化语音对话，并通过轻量级情感控制模块增强了人机交互的自然性。其核心技术包括连续视觉编码器、语义-声学分离的语音分词器及全模态对齐机制，广泛应用于客户服务、教育辅助、智能家居控制等多个领域。

AI项目与工具 2025年06月12日 55 点赞 0 评论 787 浏览

ModernBERT

ModernBERT是一种基于Transformer架构的新型编码器-only模型，是对经典BERT模型的深度优化版本。它通过在大规模数据集上的训练，提升了对长上下文的理解能力，并在信息检索、文本分类、实体识别等多个自然语言处理任务中展现出卓越性能。此外，ModernBERT在速度和资源效率方面均有显著改进，适合应用于多个领域。

AI项目与工具 2025年06月12日 36 点赞 0 评论 786 浏览

Mercury Coder

Mercury Coder 是 Inception Labs 推出的扩散型大语言模型，专为代码生成设计。它采用“从粗到细”机制，支持并行生成，每秒可处理超过 1000 个 token，效率显著高于传统模型。具备代码生成、补全、优化、多语言支持及可控生成等功能，适用于开发效率提升、教育辅助、代码优化及低代码平台集成等场景。

AI项目与工具 2025年06月12日 24 点赞 0 评论 784 浏览

Toolkami

Toolkami 是一款基于七种核心工具的 AI Agent 框架，支持自主运行和热重载功能，便于实时更新代码。其采用微服务架构，具备模块化设计和实时通信能力，兼容主流 AI 平台。适用于自动化任务、智能客服、开发测试及轻量级部署等多种场景，适合开发者快速搭建 AI 系统。

AI项目与工具 2025年06月11日 43 点赞 0 评论 782 浏览

HunyuanVideo

HunyuanVideo是一款由腾讯开源的视频生成模型，具备130亿参数量，支持物理模拟、高文本语义还原、动作一致性和电影级画质等功能。它通过时空压缩的潜在空间训练，融合Causal 3D VAE与Transformer架构，实现图像和视频的统一生成，广泛应用于电影制作、音乐视频创作、游戏开发以及教育等领域。

AI项目与工具 2025年06月12日 87 点赞 0 评论 778 浏览

架构

首页

架构

列表

默认

浏览次数

发布日期