教育

EyeDiff

EyeDiff是一款基于扩散模型的文本到图像生成工具,专为多模态眼科图像生成设计。通过自然语言提示,EyeDiff能够捕捉常见及罕见眼病的关键特征,显著提升诊断准确性。该工具采用CLIP文本编码器与交叉注意力机制,结合潜在扩散模型(LDM),生成高质量、与文本高度一致的图像,适用于数据增强、疾病筛查、数据共享及医学教育等场景。

Readtheirlips

Readtheirlips 是一款由 Symphonic Labs 开发的 AI 软件,主要用于通过分析视频中人物的嘴唇运动来识别和转录口语内容。它利用面部检测技术,提取并分析嘴唇的几何特征和动态变化,与训练数据进行匹配,以识别视频中人物所说的内容。该软件适用于听力受损人士、视频字幕生成、安全监控、教育和培训以及媒体和娱乐等多个场景。

Computer Use OOTB

Computer Use OOTB 是一款基于开源框架的 GUI 自动化工具,支持跨平台操作与远程控制,借助 Claude 3.5 Computer Use API 实现从用户指令到桌面操作的端到端自动化。其核心技术包括实时视觉信息处理、历史上下文维护及动态反馈机制,适用于远程办公、自动化测试、教育培训、家庭自动化及游戏辅助等多种场景。

BedtimeStory AI

一款由AI驱动的睡前故事生成器,允许用户为儿童和家庭成员制作个性化的睡前故事。BedtimeStory AI使用AI即时生成故事,具有可自定义的角色、流派、艺术风格和道德。

Video Ocean

Video Ocean是一款基于AI技术的视频生成平台,主要功能包括文生视频、图生视频及角色生视频。它允许用户通过文本、图片或自定义角色生成高质量的视频内容,适用于多种应用场景如社交媒体营销、教育培训、影视制作等。此外,Video Ocean还注重提升视频的质量与细节,确保最终效果既美观又实用。

DupDub

DupDub是一款由出门问问开发的AI内容生成平台,集成了AI写作、文本转语音、视频编辑等多项功能,支持70多种语言和500多种真实语音效果。它通过简化创作流程,帮助内容创作者快速生成高质量的视频、文本和音频内容,适用于营销、教育、无障碍辅助等多种应用场景,有效提升工作效率与内容影响力。

GPTEngineer

GPTEngineer 是一款基于AI技术的开源工具,通过简单的文本提示快速生成网页应用原型。它支持自然语言交互,能够根据用户描述自动生成代码,并具备代码改进、错误检测与修正等功能。此外,GPTEngineer 还支持与 GitHub 同步和一键部署。该工具兼容多种AI模型,适用于快速原型开发、Web应用开发、自动化测试、代码重构及教育等多个领域。

VAPI

VAPI是一个面向开发者的语音AI平台,凭借其简便的API集成、高精度语音识别、多语言支持以及定制化能力,能够协助开发者快速将语音技术嵌入至不同类型的软件应用中。它注重数据隐私与安全性,并提供多样化的应用场景,如智能助手、客户服务自动化、教育培训、医疗健康及呼叫中心等,帮助企业提升运营效率和服务质量。

Khanmigo

Khanmigo是由知名非营利教育组织Khan Academy开发的人工智能个人辅导和教学助手。它提供引人入胜、主题相关且有效的学习体验,并且在设计上将安全性和学习效果作为首要考虑。

灵伴科技Rokid

也和称Rokid,2014年成立,总部在杭州,创始人是前阿里巴巴M工作室负责人祝铭明,是一家专注于AI与AR技术的杭州高科技公司。