生成

Buzz

Buzz是一款基于OpenAI Whisper模型的离线语音转文字工具,支持实时语音转文字和音频视频文件转录。它具备多语言识别和翻译功能,支持多种格式导出,并能在本地离线操作以保护用户隐私。主要应用于视频字幕制作、采访记录整理、语言学习辅助、会议记录和学术研究等场景。

神采PromeAI

神采PromeAI是一款面向建筑师、室内设计师、产品设计师及游戏动漫设计师的AI设计助手。它通过强大的AIGC模型风格库,支持用户通过文字描述、草图或图片上传,快速生成高质量的设计图。此外,PromeAI还具备旧建筑翻新功能,能够提供高效的旧区改造设计方案,并支持多种风格转换和细节调整,从而实现卓越的视觉效果。

吐槽大师

“吐槽大师”是一款由Monica开发的AI工具,它能够通过分析用户的社交媒体账号来生成个性化且具有幽默感的吐槽内容。该工具主要支持Instagram、Twitter和LinkedIn三个平台,能够自动读取并分析用户的社交媒体内容,捕捉个性特征和风格,并生成独特的幽默吐槽。用户可以保存或分享生成的内容,以增加互动乐趣。

FancyVideo

FancyVideo是一款由360公司与中山大学合作开发的AI文生视频模型,采用创新的跨帧文本引导模块(CTGM)。它能够根据文本描述生成连贯且动态丰富的视频内容,支持高分辨率视频输出,并保持时间上的连贯性。作为开源项目,FancyVideo提供了详尽的文档和代码库,便于研究者和开发者深入研究和应用。主要功能包括文本到视频生成、跨帧文本引导、时间信息注入及时间亲和度细化等。

MovieDreamer

MovieDreamer是一个由浙江大学与阿里巴巴联合开发的AI视频生成框架,专为长视频设计。该框架结合自回归模型和扩散渲染技术,生成复杂的长视频内容。它支持多层次叙事一致性、高质量视觉渲染和多模态脚本,适用于电影预告片、VR叙事、教育视频和游戏内剧情等多种场景。

Odyssey

Odyssey是一款先进的AI视频生成和编辑工具,通过四个专门训练的高级生成模型,实现高质量的三维几何图形、逼真材质、震撼光照效果及动态动作控制。该工具旨在革新电影、电视和视频游戏的制作方式,提升创作效率,同时保证作品的高质量和艺术性。适用于电影制作人、游戏开发者、视频内容创作者、动画师和视觉效果艺术家。

Fotographer AI

Fotographer AI是一款基于AI技术的图像生成工具,能够快速生成专业级产品图像,并提供多样化的广告模特图像。该工具支持文本和模板定制,简化创作流程。此外,它还能即时生成博客、新闻稿等营销材料。试用期免费,同时提供企业级服务选项,包括图像生成和账户管理。

HybridRAG

HybridRAG是一种结合了检索增强生成模型的混合架构,通过检索系统和生成模型的协同工作,生成更准确和丰富的输出。其主要功能包括信息检索、上下文理解、知识融合和生成能力。HybridRAG适用于多种自然语言处理任务,如问答系统、文本摘要和对话生成,能够利用大量外部知识提高生成内容的质量和相关性。

xGen

xGen-MM是一款由Salesforce开发的开源多模态AI模型,具备处理文本和图像等数据类型的能力。该模型通过学习大量图像和文字信息,在视觉语言任务中表现出色,并通过开源模型、数据集和微调代码库促进模型性能的提升。xGen-MM具有多模态理解、大规模数据学习、高性能生成、开源可访问和微调能力等特点。其应用场景广泛,包括图像描述生成、视觉问答、文档理解、内容创作和信息检索等。

浦语灵笔

浦语灵笔IXC-2.5是一款由上海人工智能实验室开发的多模态大模型,具备7B规模的大型语言模型后端,能够处理长上下文、超高分辨率图像和细粒度视频理解,支持多轮多图像对话。该模型可以自动生成网页代码和高质量图文内容,在多模态基准测试中表现出色,性能可与OpenAI的GPT-4V相媲美。