实时

Open Avatar Chat

Open Avatar Chat是阿里开源的模块化实时数字人对话系统,支持低延迟交互与多模态输入输出。系统采用模块化架构,允许灵活配置语音识别、语言模型和语音合成等组件,兼容本地与云服务。支持2D/3D数字人渲染,适用于客户服务、教育、娱乐及企业应用等多个场景,为开发者提供高效、灵活的AI对话解决方案。

Parakeet TDT 0.6B

Parakeet TDT 0.6B 是一款由英伟达开发的开源自动语音识别(ASR)模型,采用 FastConformer 和 TDT 架构,具备高速转录、高精度识别、歌词转录、文本格式化等功能。模型在 Hugging Face Open ASR Leaderboard 中表现优异,实时因子高达 3386,适用于会议记录、法律医疗、字幕生成及音乐索引等多种场景。

百度股市通

一款利用大数据引擎技术的股票分析与投资辅助应用,汇聚全球金融市场的股票、基金、外汇、期货等实时行情,帮助投资者做出更为明智的决策。

AI Anime Generator

AI Anime Generator 是一款基于人工智能技术的在线工具,能够根据用户提供的文本描述或上传的照片生成具有动漫风格的图像。该工具支持文本到动漫生成、照片到动漫转换、多种动漫风格选择、实时生成和视频转换等功能,适用于角色设计、虚拟主播形象设计、动漫艺术教育、社交媒体内容制作及粉丝艺术创作等场景。

雅意大模型

雅意大模型是安全可靠的企业级专属大模型,具备5大核心能力,共100多个特色技能。

Grimo

Grimo 是一款集成多种 AI 技术的写作辅助工具,支持语音输入、提示管理、实时网络搜索和团队协作等功能,适用于作家、内容创作者及专业人员。其提供多个版本以满足不同需求,具备高度定制化和智能化特性,有效提升写作效率和内容质量。

Docmost

一款开源的Wiki协作和文档管理软件,可以为团队和个人提供一个强大的文档协作平台。Docmost类似于 Notion 和飞书等商业产品,但完全开源,用户可以自由本地部署和使用。

Pi智能演示文档

Pi是一款利用AI技术提升演示文档创作效率的互动内容平台,支持多种内容生成模式(一句话生成、文件导入、URL导入),并配备智能编辑器与多终端适配功能。它提供了丰富的主题配色与组件素材,可帮助用户快速创建高质量的专业演示文档,广泛应用于商务、教育和个人场景中。

OBS Studio

一款免费开源的视频录制及直播串流软件,用户可以通过OBS Studio创建包含多种视频源的场景,进行视频捕捉、合成、编码和录制,支持Windows、macOS、Linux和BSD等多个平台。

VASA

VASA-1是一个由微软亚洲研究院开发的生成框架,能够将静态照片转化为动态的口型同步视频。该框架利用精确的唇音同步、丰富的面部表情和自然的头部运动,创造出高度逼真的虚拟人物形象。VASA-1支持在线生成高分辨率视频,具有低延迟的特点,并且能够处理多种类型的输入,如艺术照片、歌唱音频和非英语语音。此外,通过灵活的生成控制,用户可以调整输出的多样性和适应性。