模型 - 智狐AI导航

Pixel Reasoner

Pixel Reasoner是由多所高校联合开发的视觉语言模型，通过像素空间推理增强对视觉信息的理解和分析能力。它支持直接对图像和视频进行操作，如放大区域或选择帧，以捕捉细节。采用两阶段训练方法，结合指令调优和好奇心驱动的强化学习，提升视觉推理性能。在多个基准测试中表现优异，适用于视觉问答、视频理解等任务，广泛应用于科研、教育、工业质检和内容创作等领域。

AI项目与工具 2025年06月11日 30 点赞 0 评论 600 浏览

PersonaCraft

PersonaCraft是一种结合扩散模型和3D人体建模的全身图像合成技术，能够从单一参考图像生成多个逼真的个性化全身图像。它支持遮挡处理、用户自定义身体形状，并通过3D感知姿态条件控制提高生成图像的质量。该工具广泛应用于社交媒体、广告、时尚、游戏及电影等领域，为个性化定制提供了强大的技术支持。

AI项目与工具 2025年06月12日 23 点赞 0 评论 599 浏览

码多多AI智能论文写作系统

基于前后端分离架构以及Vue3、uni-app、ThinkPHP6.x、PHP8.0技术栈开发，包含PC端、H5自适应。

Ai编程建站 2025年06月05日 98 点赞 0 评论 599 浏览

cpmGO

cpmGO是面壁智能推出的端侧智能助手，专为汽车座舱设计，支持多模态交互与本地化处理，保障隐私并适应弱网环境。其基于MiniCPM模型优化，具备智能任务处理、快速响应及灵活定制能力，适用于多种智能汽车场景，提升人车交互的便捷性与安全性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 599 浏览

WhisperFusion

一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。

Ai开源项目 2025年06月05日 42 点赞 0 评论 599 浏览

画颜AI

画颜AI写真是一款利用人工智能技术的在线照相馆应用，用户可以上传自己的照片，应用将自动为用户生成具有艺术感的写真。

Ai图片处理 2025年06月05日 11 点赞 0 评论 598 浏览

ScriptViz

ScriptViz是一款基于MovieNet数据库的剧本可视化工具，利用CLIP模型实现剧本文本与电影画面的匹配，支持用户通过SQL语句设定剧本属性并生成视觉化参考。其功能涵盖视觉素材检索、剧本与视觉匹配、故事分析及对话对齐可视化，旨在提升剧本创作过程中的视觉表现力和叙事连贯性。此外，ScriptViz还提供情绪捕捉、场景细化及角色开发等应用，适用于剧本开发、故事板制作等多个场景。

AI项目与工具 2025年06月12日 18 点赞 0 评论 598 浏览

DDColor图像上色

一个为黑白图像上色的魔搭模型，通过双解码器实现逼真的图像着色，输入一张黑白图像，实现端到端的全图上色，返回上色处理后的彩色图像。

Ai开源项目 2025年06月05日 38 点赞 0 评论 597 浏览

天壤小白大模型

天壤自研新一代通用语言大模型，具备面向多语言的对话互动、知识问答、逻辑推理等核心能力。

Ai平台模型 2025年06月05日 72 点赞 0 评论 597 浏览

PersonaMagic

PersonaMagic 是一种基于文本条件策略的人脸生成技术，通过动态嵌入学习和双平衡机制实现高保真个性化图像生成。该工具可依据文本提示调整人脸风格、表情和背景，同时保持身份特征。支持单图像训练，降低数据需求，并可与其他模型结合使用。实验显示其在文本对齐和身份保持方面表现优异，适用于娱乐、游戏、影视及营销等多个领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 596 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期