工具

FlowCV

帮助像你这样的求职者充分发挥他们的潜力

Ovis2

Ovis2是阿里巴巴国际团队开发的多模态大语言模型,采用结构化嵌入对齐技术提升视觉与文本的融合效果。支持视频、图像和多语言处理,强化了思维链推理和复杂场景下的OCR能力。提供多个参数规模的版本,适用于研究、开发及各类应用场景,展现卓越性能。

Audio Decomposition

Audio Decomposition 是一款基于傅里叶变换和信封匹配技术的开源音频处理工具,能够分离音乐中的不同乐器声音并生成乐谱。它支持音乐转录、教育、制作及分析,通过深度音频处理为用户提供了强大的音乐解析能力。

AI酱

AI酱是一款结合二次元元素与AI技术的多语言智能聊天工具,支持多种语言交流,具备语音识别和即时反馈功能。它通过生动的角色形象和标准化发音,帮助用户练习外语口语,并能在情绪疏导、旅行规划等方面提供个性化服务。此外,其多角色设定和场景切换功能进一步增强了用户体验。

Deep Research

Deep Research是由OpenAI开发的一款AI深度搜索与研究工具,支持多步骤自主研究,适用于金融、科学、政策等领域。基于o3模型,结合强化学习技术,能高效整合网络信息并生成结构化研究报告。用户可通过提示词触发研究流程,系统自动生成引用清晰、逻辑严谨的成果,适用于学术研究、市场分析、投资决策等场景。

Snapcut

Snapcut是一款基于人工智能技术的视频编辑工具,能够将长视频自动剪辑为适配社交媒体的短视频。它支持多种视频格式和语言字幕,具备一键生成、智能分析、画面重组和字幕生成等核心功能,广泛应用于教育、营销、娱乐等多个领域,帮助用户高效完成视频内容创作。

AIpai

AIpai是一款AI视频创作Agent工具,支持用户快速生成专业视频内容。其主要功能包括智能编剧、角色设计、场景构建、图像生成、视频生成、声音设置和参数调整。用户只需输入文案,AIpai即可自动生成分镜、图像和视频选项,并支持多种风格和参数定制。适用于短视频制作、品牌宣传、个人创作、教育领域和影视制作等多种场景,大幅提升创作效率,降低制作门槛。

Fellou AI浏览器

由中国95后创业者谢扬及其团队推出的全球首个行动型浏览器,它将浏览器、AI Agent和工作流自动化相结合。

Ming

Ming-Lite-Omni是蚂蚁集团开源的统一多模态大模型,基于MoE架构,支持文本、图像、音频和视频等多种模态的输入输出,具备强大的理解和生成能力。模型在多个任务中表现优异,如图像识别、视频理解、语音问答等,适用于OCR识别、知识问答、视频分析等多个领域。其高效处理能力和多模态交互特性,为用户提供一体化智能体验。

Chichi

一个专注于AI生成图像的日本网站,只要针对动漫爱好者、数字艺术家和影像设计师群体,生成动漫风格的插图、写实照片以及日本流行的写真风格。