工具

Pitch

一款演示软件,可以让任何团队快速创建出时尚且有效果的ppt演示文稿。Pitch可用于演示文稿、销售文稿、团队会议、董事会文稿、演讲和模板。

TTS-Voice-Wizard

TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100...

LinkFox AI

LinkFox AI是一款专为跨境电商设计的AI电商工具,提供AI文案生成、高效作图、场景设计等功能,支持商品图合成、AI模特换装、商品背景替换等特色功能,同时集成多种分析工具,助力卖家优化运营策略,提升国际市场竞争优势。

CreatorKit AI

CreatorKit 的 AI 照片工具彻底改变了企业的产品摄影,为创建高质量图像提供了无缝且经济高效的解决方案。CreatorKit直接与 Shopify 集

Wavtool

Wavtool 是一款基于浏览器的 AI 音频创作平台,支持录制、编曲、混音和导出音乐,提供 AI 辅助创作功能,支持多轨处理及高级合成工具。用户可通过浏览器直接操作,无需安装软件,适合音乐爱好者、专业人士及教育用途。

FabPic

一款功能强大、免费的屏幕截图美化工具,FabPic特别适合于截图的美化,提供阴影、边框、圆角等多种视觉效果。

BedtimeStory AI

一款由AI驱动的睡前故事生成器,允许用户为儿童和家庭成员制作个性化的睡前故事。BedtimeStory AI使用AI即时生成故事,具有可自定义的角色、流派、艺术风格和道德。

AndroidLab

AndroidLab 是一款面向 Android 自主代理的训练与评估框架,集成了文本和图像模态操作环境,提供标准化的基准测试任务。它通过支持多种模型类型(LLMs 和 LMMs),覆盖九个应用场景的 138 项任务,有效提升了开源模型的性能。此外,AndroidLab 提供了丰富的评估指标和操作模式,助力研究者优化模型表现并推动开源解决方案的发展。

Pixel3DMM

Pixel3DMM是由慕尼黑工业大学、伦敦大学学院和Synthesia联合开发的单图像3D人脸重建框架,基于DINOv2模型,能从单张RGB图像中准确重建出3D人脸的几何结构。该工具擅长处理复杂表情和姿态,支持身份和表情的解耦,并通过FLAME模型优化实现高精度重建。其应用场景涵盖影视游戏、VR/AR、社交视频、医疗美容和学术研究。