I ♡ Captions I ♡ Captions轻松为视频和音频创建高质量的字幕。上传您的内容,根据渠道的具体要求生成精确的字幕,将字幕工作量减少高达75%。 字幕配音 2025年06月05日 12 点赞 0 评论 439 浏览
TextHarmony TextHarmony是一款由华东师范大学与字节跳动联合开发的多模态生成模型,擅长视觉与文本信息的生成与理解。该模型基于Slide-LoRA技术,支持视觉文本生成、编辑、理解及感知等功能,广泛应用于文档分析、场景文本识别、视觉问题回答、图像编辑与增强以及信息检索等领域。通过高质量数据集的构建与多模态预训练,TextHarmony在视觉与语言生成任务中表现出色。 AI项目与工具 2025年06月12日 47 点赞 0 评论 434 浏览
Trancy Trancy是一款专为语言学习设计的浏览器插件,提供YouTube/Netflix双语字幕、网页AI划词翻译和全文翻译等功能,用于提升语言学习效率。 Ai办公效率 2025年06月05日 29 点赞 0 评论 434 浏览
字幕库 | zimuku 字幕库是一个专业的超级丰富的影视字幕网站及字幕下载平台,提供了海量的电影、电视剧、动漫、纪录片等视频的中英双语字幕,包含了国内外的电影和电视剧等影视字幕资源。 影视资源 2025年06月05日 10 点赞 0 评论 433 浏览
Framedrop Framedrop是一款基于AI技术的在线工具,专注于从长视频中提取精彩片段并转化为短视频。它支持多平台视频导入,具备自动高光检测、智能剪辑、多语言字幕生成等功能,适合游戏直播、播客、教育等多种内容类型,帮助创作者提高效率并增强社交媒体传播力。 AI项目与工具 2025年06月12日 22 点赞 0 评论 428 浏览
VoicePen Ai 一款语音转博客AI工具,使用VoicePen可以在几分钟内将音频、视频、语音备忘录和网站转换为博客文章。 Ai语音工具 2025年06月05日 76 点赞 0 评论 421 浏览
VideoCaptioner VideoCaptioner是一款基于大语言模型的智能字幕处理工具,支持语音识别、字幕优化、翻译、样式调整及视频合成等功能。无需GPU即可运行,兼容多语言和多种字幕格式,适用于视频创作者、教育工作者及字幕翻译团队,提升字幕制作效率与质量。 AI项目与工具 2025年06月12日 50 点赞 0 评论 420 浏览
Memo.ac Memo是一款将视频转换为翻译文本、字幕和笔记的工具,它支持多语言,可以在中文、英文、日文和90多种语言之间进行转录和翻译。 Ai语音工具 2025年06月05日 62 点赞 0 评论 418 浏览
AIMv2 AIMv2是苹果公司开发的开源多模态自回归预训练视觉模型,通过图像与文本的深度融合提升视觉理解能力。其采用图像块与子词标记拼接的方式进行自回归预训练,支持多种参数规模,适用于不同设备。具备视觉问答、指代表达理解、图像字幕生成、多媒体检索等功能,并可无缝集成到大型语言模型中。模型在多个视觉任务中表现优异,具备良好的可扩展性和零样本适应能力。 AI项目与工具 2025年06月12日 48 点赞 0 评论 415 浏览