ChatHi 一个大模型集成平台,ChatHi集成了国内外知名文生文大模型13家,文生图大模型5家,是一款人工智能聊天助手,专注于提供智能化的对话体验和全面的信息检索。 Ai平台模型 2025年06月05日 53 点赞 0 评论 338 浏览
万兴天幕多媒体大模型 一个涵盖了视觉、音频、语言等多模态AI生成和优化能力的多媒体大模型,万兴天幕多媒体大模型核心功能包括一键成片、AI美术设计、文生音乐、音频增强、音效分析、多语言对话等。 Ai平台模型 2025年06月05日 40 点赞 0 评论 144 浏览
LiberSonora 一个基于AI的、开源有声书工具集,LiberSonora提供智能字幕提取、AI标题生成、多语言翻译等功能,并且支持 GPU 加速、批量离线处理。 Ai开源项目 2025年06月05日 65 点赞 0 评论 433 浏览
Tarsier 字节跳动推出的一系列大规模视觉语言模型(LVLM),专注于视频理解任务,包括视频描述、问答、视频定位、幻觉测试等功能。 Ai开源项目 2025年06月05日 90 点赞 0 评论 255 浏览
Linly 一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。 Ai开源项目 2025年06月05日 38 点赞 0 评论 305 浏览
VideoSrt VideoSrt是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。 Ai开源项目 2025年06月05日 31 点赞 0 评论 184 浏览