模型 - 智狐AI导航

SoraWebui

一个开源项目，允许用户使用 OpenAI Sora 模型使用文本在线生成视频，从而简化视频创建，并具有轻松的一键网站部署功能。

Ai开源项目 2025年06月05日 62 点赞 0 评论 921 浏览

Image

Image-01 是一款由 MiniMax 开发的文本到图像生成模型，能够根据文本描述精准生成高质量、高分辨率图像，支持多种纵横比输出。具备优秀的人物与物体渲染能力，适用于艺术创作、广告设计、影视制作等多个领域。支持高效批量生成，单次最多输出 9 张图像，每分钟处理 10 个请求，提升创作效率。采用扩散模型与 Transformer 架构，结合线性注意力与 MoE 技术，确保图像质量与生成效率。

AI项目与工具 2025年06月12日 95 点赞 0 评论 921 浏览

交小智

交小智是西安交通大学推出的AI应用平台，支持用户零代码创建智能体，适用于教学、科研和校园生活等多种场景。平台集成多种大模型，具备知识库管理、插件扩展、API接口等功能，可定制问答机器人、科研助手、校园服务工具等。用户可发布智能体并与其他系统集成，提升工作效率与服务体验。

AI项目与工具 2025年06月12日 73 点赞 0 评论 921 浏览

光语大模型

无限光年公司发布的一款结合大语言模型与符号推理的AI大模型，光语大模型目的是解决大模型在行业应用中的幻觉问题，提高了模型的可信度和专业性。

Ai平台模型 2025年06月05日 89 点赞 0 评论 921 浏览

Vision Search Assistant

Vision Search Assistant (VSA) 是一种结合视觉语言模型与网络代理的框架，旨在提升模型对未知视觉内容的理解能力。它通过网络检索，使 VLMs 能够处理和回答有关未见图像的问题。VSA 在开放集和封闭集问答测试中表现出色，支持图像描述生成、网络知识搜索、协作生成等功能，可应用于图像识别、新闻分析、教育、电商和旅游等多个领域。

AI项目与工具 2025年06月12日 100 点赞 0 评论 921 浏览

AIGC电商解决方案 | @未来力场

生成式 AI 在跨境电商业务流程里能转化为生产力的环节和对应的解决方案有几种分类：按对人力的替换分类，按通用工具分类，按电商场景，按生成对象。

电商运营 2025年06月05日 48 点赞 0 评论 922 浏览

In

In-Context LoRA是一种基于扩散变换器（DiTs）的图像生成框架，通过微调少量数据实现多样化图像生成任务。它无需修改原始模型结构，减少了对大规模标注数据的依赖，同时保持了高质量的生成效果。该工具支持多任务图像生成、上下文学习能力、任务无关性以及条件图像生成等功能，适用于故事板生成、字体设计、家居装饰等多个领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 923 浏览

PixVerse V2.5

PixVerse V2.5是一款由爱诗科技开发的AI视频生成工具，其主要功能包括模型优化、提高生成速度、支持4K分辨率、Performance模式、运动笔刷、运镜控制以及文本内容生成。这些功能共同提升了视频创作的动态效果和专业度，使得用户能够更快地生成高质量视频内容。PixVerse V2.5支持多种语言界面，适用于创意视频制作、广告和营销、教育和培训、社交媒体内容以及游戏和动画制作等领域。

AI项目与工具 2025年06月12日 62 点赞 0 评论 923 浏览

Whisper Input

Whisper Input 是一款开源语音输入工具，基于 Python 和 OpenAI Whisper 模型开发，支持多语言语音识别与实时转录。用户可通过快捷键操作录音并生成文本，具备翻译、自动标点、高效处理及本地运行等功能。适用于会议记录、教育、智能交互及媒体制作等多种场景。

AI项目与工具 2025年06月12日 29 点赞 0 评论 923 浏览

MacWhisper是一款基于OpenAI Whisper技术的AI音频转文字工具。它能够在本地设备上将音频文件快速转录成文本，并支持多种语言。该工具具有多种音频和视频格式兼容性，提供不同的转录模型选择，支持字幕导出，且具备视频播放功能。最新版本增加了基于Apple芯片的硬件加速，提升了实时语音识别效率，并集成了OpenAI语言模型以提高转录和翻译的准确性。MacWhisper适用于记者、媒体工作

AI项目与工具 2025年06月12日 15 点赞 0 评论 923 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期