工具 - 智狐AI导航

iTextMaster

iTextMaster是一款AI驱动的文本分析与交互工具，支持用户通过对话形式快速总结PDF文档和网页内容，具备精准搜索与智能推荐功能。它广泛应用于学术研究、法律行业、商业分析、教育以及项目管理等领域，助力用户高效处理信息并提升工作效率。

AI项目与工具 2025年06月12日 87 点赞 0 评论 876 浏览

VideoFusion

VideoFusion 是一款开源的短视频处理工具，支持自动去除黑边、水印和字幕，智能旋转视频方向，提升画质，并兼容多种视频格式。具备批量处理、自定义设置和实时进度反馈功能，适用于视频创作者、自媒体运营及企业等多场景应用。

AI项目与工具 2025年06月12日 27 点赞 0 评论 876 浏览

Co

Co-op Translator是一款基于Azure AI服务的开源多语言翻译工具，支持Markdown文件及图像文本的自动化翻译。它采用先进的大型语言模型（LLM）技术，确保翻译质量的同时保持语义准确性和上下文连贯性。该工具可无缝集成到现有项目中，帮助简化本地化流程，适用于开源项目文档、软件开发、技术博客、教育材料以及企业内部文档等多种应用场景。

AI项目与工具 2025年06月12日 81 点赞 0 评论 875 浏览

Bugasura

Bugasura，一款能够帮助您自动查找和修复程序中的BUG和简化测试工作流程的工具。

Ai编程建站 2025年06月05日 44 点赞 0 评论 875 浏览

ParGo

ParGo是一种由字节与中山大学联合开发的多模态大语言模型连接器，通过结合局部与全局token，提升视觉与语言模态的对齐效果。其核心模块PGP和CPP分别提取图像的局部和全局信息，增强细节感知能力。在多个基准测试中表现优异，尤其在文字识别和图像描述任务中优势明显。采用自监督学习策略，提高模型泛化能力，适用于视觉问答、图像字幕生成、跨模态检索等多种场景。

AI项目与工具 2025年06月12日 38 点赞 0 评论 875 浏览

Vision Search Assistant

Vision Search Assistant (VSA) 是一种结合视觉语言模型与网络代理的框架，旨在提升模型对未知视觉内容的理解能力。它通过网络检索，使 VLMs 能够处理和回答有关未见图像的问题。VSA 在开放集和封闭集问答测试中表现出色，支持图像描述生成、网络知识搜索、协作生成等功能，可应用于图像识别、新闻分析、教育、电商和旅游等多个领域。

AI项目与工具 2025年06月12日 100 点赞 0 评论 875 浏览

Talefy Ai

AI互动故事生成器，Talefy Ai能够帮助用户轻松创作各种类型的互动故事，将脑海中的故事具象化，并提供沉浸式的故事体验。

生活创意 2025年06月05日 89 点赞 0 评论 875 浏览

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库，具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别，适用于语音助手、会议记录、实时字幕等场景，提供灵活的音频输入与预处理机制，便于开发者快速集成和扩展。

AI项目与工具 2025年06月12日 97 点赞 0 评论 875 浏览

HiDream

HiDream-I1是一款由HiDream.ai团队开发的开源AI图像生成模型，具备17亿参数，支持多种图像风格生成，包括真实、卡通和艺术风格。其在提示词理解、细节渲染和图像一致性方面表现出色，适用于艺术创作、商业设计、教育科研等领域。模型采用扩散模型和混合专家架构（MoE），并集成多种文本编码器，实现高质量与高效率的图像生成。项目已在GitHub和HuggingFace开源，便于研究与应用。

AI项目与工具 2025年06月12日 64 点赞 0 评论 874 浏览

笔墨写作

专注于公文、教学、论文写作的AIGC创作平台。为用户提供AI生成功能以及格式模板、优质范文等素材数据库，突破创作瓶颈，生成高质量内容。

AI写作对话 2025年06月05日 70 点赞 0 评论 874 浏览

工具

首页

工具

列表

默认

浏览次数

发布日期