工具

Poly Haven

基于CC0共享协议的高质量3D模型、纹理贴图资源下载网站,Poly Haven无需注册账户直接下载,可免费商用。

VideoGrain

VideoGrain是由悉尼科技大学与浙江大学联合研发的零样本多粒度视频编辑框架,支持类别级、实例级和部件级的精细化视频修改。它通过调节时空交叉注意力和自注意力机制,提升文本提示对目标区域的控制能力,确保时间一致性与特征分离,显著优于现有T2I和T2V方法。该工具无需额外参数调整,具备高效计算性能,适用于影视制作、广告营销、内容创作等多个领域。

SongR

SongR是一款基于AI技术的在线歌曲创作工具,支持用户输入关键词和选择音乐风格来自动生成歌词和旋律。它提供了歌词编辑、自动谱曲、AI演唱等功能,并兼容多平台,适合个人娱乐、教育学习、商业广告等多种应用场景。用户能够轻松生成高质量的歌曲,满足个性化需求。

VideoToWords AI

一款免费在线将视频和音频转录为文本的工具,轻松在浏览器中将视频转换为文本,添加字幕等。还提供在线编辑、多种格式导出功能。

MMSearch

MMSearch 是一款用于评估大型多模态模型(LMMs)搜索能力的基准测试工具,包含 MMSearch-Engine 框架和 MMSearch 测试集。其核心功能包括问题重构、网页排序和答案总结,通过多模态搜索能力评估提升 LMMs 的性能。实验结果显示 GPT-4o 在该测试中表现优异,且增加计算量比扩大模型规模更具优势。

量子行星科技有限公司

量子行星信息科技有限公司是一家专注提供人工智能解决方案的产品服务型公司,总部位于北京。

Covers AI

一款功能强大的AI声音和歌曲生成器工具,允许用户使用来自著名主播、政治家、歌手、卡通人物等的数千种声音生成 AI 翻唱。

SVG Converter

SVG Converter是一款高效的在线矢量转换工具,可将多种位图格式(如JPG、PNG、BMP)转换为SVG、AI、EPS等矢量格式。支持高精度输出、像素级调整、多层结构及颜色自定义,操作简便,适用于网页设计、图形编辑、Logo制作等多个领域。

Hama

帮助用户上传图片、并用AI技术将画面中不想要的部分抹除

BoldVoice

BoldVoice 是一款专注于英语发音训练的工具,结合专业口音课程与AI语音分析技术,帮助非英语母语者提升发音准确性和口语自信。用户可通过录音获得实时反馈与改进建议,并根据个人母语背景定制学习计划。应用还提供发音测试、口音对比和多场景练习功能,适用于职场、考试、日常交流及表演等领域,有效提升英语口语能力。