模型 - 智狐AI导航

Pixel Reasoner

Pixel Reasoner是由多所高校联合开发的视觉语言模型，通过像素空间推理增强对视觉信息的理解和分析能力。它支持直接对图像和视频进行操作，如放大区域或选择帧，以捕捉细节。采用两阶段训练方法，结合指令调优和好奇心驱动的强化学习，提升视觉推理性能。在多个基准测试中表现优异，适用于视觉问答、视频理解等任务，广泛应用于科研、教育、工业质检和内容创作等领域。

AI项目与工具 2025年06月11日 30 点赞 0 评论 599 浏览

码多多AI智能论文写作系统

基于前后端分离架构以及Vue3、uni-app、ThinkPHP6.x、PHP8.0技术栈开发，包含PC端、H5自适应。

Ai编程建站 2025年06月05日 98 点赞 0 评论 599 浏览

PersonaCraft

PersonaCraft是一种结合扩散模型和3D人体建模的全身图像合成技术，能够从单一参考图像生成多个逼真的个性化全身图像。它支持遮挡处理、用户自定义身体形状，并通过3D感知姿态条件控制提高生成图像的质量。该工具广泛应用于社交媒体、广告、时尚、游戏及电影等领域，为个性化定制提供了强大的技术支持。

AI项目与工具 2025年06月12日 23 点赞 0 评论 598 浏览

WhisperFusion

一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。

Ai开源项目 2025年06月05日 42 点赞 0 评论 598 浏览

cpmGO

cpmGO是面壁智能推出的端侧智能助手，专为汽车座舱设计，支持多模态交互与本地化处理，保障隐私并适应弱网环境。其基于MiniCPM模型优化，具备智能任务处理、快速响应及灵活定制能力，适用于多种智能汽车场景，提升人车交互的便捷性与安全性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 597 浏览

ScriptViz

ScriptViz是一款基于MovieNet数据库的剧本可视化工具，利用CLIP模型实现剧本文本与电影画面的匹配，支持用户通过SQL语句设定剧本属性并生成视觉化参考。其功能涵盖视觉素材检索、剧本与视觉匹配、故事分析及对话对齐可视化，旨在提升剧本创作过程中的视觉表现力和叙事连贯性。此外，ScriptViz还提供情绪捕捉、场景细化及角色开发等应用，适用于剧本开发、故事板制作等多个场景。

AI项目与工具 2025年06月12日 18 点赞 0 评论 597 浏览

PersonaMagic

PersonaMagic 是一种基于文本条件策略的人脸生成技术，通过动态嵌入学习和双平衡机制实现高保真个性化图像生成。该工具可依据文本提示调整人脸风格、表情和背景，同时保持身份特征。支持单图像训练，降低数据需求，并可与其他模型结合使用。实验显示其在文本对齐和身份保持方面表现优异，适用于娱乐、游戏、影视及营销等多个领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 596 浏览

TinyTroupe

TinyTroupe是一款基于大型语言模型的Python库，专注于生成逼真的虚拟人物行为。它通过构建虚拟角色（TinyPerson）与环境（TinyWorld），实现个性化、高自由度的行为模拟，并支持多智能体间的互动。该工具适用于市场研究、产品测试、用户体验优化等多个领域，为企业提供洞察力与决策支持。 ---

AI项目与工具 2025年06月12日 69 点赞 0 评论 596 浏览

天壤小白大模型

天壤自研新一代通用语言大模型，具备面向多语言的对话互动、知识问答、逻辑推理等核心能力。

Ai平台模型 2025年06月05日 72 点赞 0 评论 596 浏览

Takin AudioLLM

Takin AudioLLM是一套由喜马拉雅Everest团队研发的语音生成模型，包含文本转语音（Takin TTS）、音色转换（Takin VC）及声音风格变换（Takin Morphing）。它采用最新大型语言模型技术，可生成接近真人的高质量语音，并支持个性化定制与零样本学习。该工具广泛应用于有声书制作、虚拟助手、电影配音等领域，具有音色精准、风格多样等特点。

AI项目与工具 2025年06月12日 63 点赞 0 评论 596 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期