学习

Hertz

Hertz-Dev是一款由Standard Intelligence开发的开源音频模型,专注于低延迟实时对话AI。它具备强大的音频生成与处理能力,能够处理和生成高质量的音频信号,并支持多任务微调,适用于语音识别、语音合成等多种应用场景。此外,Hertz-Dev还提供了音频自动编码、流式生成等功能,广泛应用于智能助手、客户服务、语音识别及合成等领域。

清图

清图 - 模糊图片秒变清晰,一个基于深度学习技术的在线图像处理平台

My Drama

My Drama是一款创新的短剧应用,结合了AI聊天机器人技术,提供超过30部肥皂剧和短剧。用户不仅能观看这些剧集,还可以与剧中的AI角色进行互动对话,从而增强沉浸感。My Drama通过AI技术降低制作成本并提高内容生产效率,提供个性化的互动体验,并探索互动叙事的新领域。该应用可在Web、iOS和Android设备上使用,部分剧集免费,高级内容需付费解锁。

音刻

Inkr 是一款高效的 AI 语音转录工具,支持超过 100 种语言,具备快速转录、多语言支持、说话人识别、高准确率等功能。其“FLASH”模式可在几秒内完成转录,适用于会议记录、采访整理、字幕制作及学习辅助等多种场景,提升信息处理效率。

Gatekeep Ai

一个新型的文本转视频AI,专注教学,Gatekeep Ai通过AI生成的视频,将复杂的数学问题和概念用更简单、更直观的方式呈现给学习者。

OMNE Multiagent

OMNE Multiagent是一个基于长期记忆技术的大模型多智能体框架,由天桥脑科学研究院开发。它支持多个智能体协同工作,每个智能体能独立学习和理解环境,具备深度慢思考和实时适应能力。OMNE框架通过优化搜索空间和逻辑推理机制,提升了复杂问题的决策效率,并在金融、交通、制造、医疗等领域展现出广泛应用潜力。

Deep Art Effects

Deep Art Effects 是一款利用深度学习技术的在线工具,能够将普通照片转换为具备多种艺术风格(如梵高、毕加索等)的作品。其主要功能包括艺术风格转换、高分辨率输出、丰富的艺术风格库以及 API 集成支持。该工具适用于个人娱乐、艺术创作、教育、广告及社交媒体内容创作等多个领域。

CodeDPO

CodeDPO是一款由北京大学与字节跳动合作开发的代码生成优化框架,主要功能包括提升代码准确性、优化代码效率、集成偏好学习、自动生成与验证代码及测试用例、构建优化数据集以及减少对外部资源的依赖。它采用自生成与验证机制、PageRank启发式算法及Direct Preference Optimization等技术,广泛应用于自动化软件开发、代码辅助编写、编程教育、代码质量保障及优化重构等领域。

Florence

Florence-2是微软Azure AI团队研发的多功能视觉模型,支持图像描述、目标检测、视觉定位和图像分割等功能。该模型基于Transformer架构,采用序列到序列学习方法,利用自注意力机制实现多模态信息融合。通过训练大规模数据集,Florence-2在多个应用场景中表现出色,包括图像和视频分析、内容审核、辅助驾驶、医疗影像分析以及零售和库存管理。

TextDiffuser-2

一个功能强大的图像生成工具,它通过扩散模型技术,根据文本描述生成高质量的图像。这个工具为用户提供了一种创新的方式来探索和实现他们的创意视觉概念。