教育辅助

EMOVA

EMOVA是一款由多所高校与企业联合研发的多模态全能型AI助手,具备处理图像、文本和语音的能力,支持情感化语音对话,并通过轻量级情感控制模块增强了人机交互的自然性。其核心技术包括连续视觉编码器、语义-声学分离的语音分词器及全模态对齐机制,广泛应用于客户服务、教育辅助、智能家居控制等多个领域。

GenFM

GenFM是一款由ElevenLabs开发的AI工具,可将PDF、文章、电子书等内容转换为多角色播客音频。它支持32种语言,具备自动化声音选择、人性化填充词添加及高度定制化功能,适用于教育、播客制作、有声书创作、商业推广等多个领域。

图趣AI

图趣AI是一款基于人工智能技术的创意工具,可通过文字描述生成多样化的艺术画作,涵盖风景、奇幻、艺术画及超现实等风格。它还提供AI艺术字、风格转换、平面设计及视频生成等功能,适用于个人创意表达、社交媒体内容创作、教育学习、广告营销及平面设计等多个领域。

TEN Agent

TEN Agent 是一款开源的实时多模态 AI 框架,集成了 OpenAI 实时 API 和 RTC 技术,支持语音、文本和图像的多模态交互。它具备天气查询、网络搜索、视觉识别及 RAG 等功能,支持高性能实时通信和模块化扩展,适用于智能客服、语音助手、教育辅助、智能家居控制和健康咨询等多个领域。

360gpt2

360gpt2-o1是一款专注于数学与逻辑推理的人工智能大模型,具备强大的推理能力和深度学习能力。它通过合成数据优化、分阶段训练及“慢思考”范式提升了模型的表现,尤其在数学竞赛和基础数学评测中成绩显著。此外,模型还支持编程问题解决、复杂问题分析及教育领域应用,为企业决策提供逻辑支持。

k1 视觉思考模型

K1视觉思考模型是一款基于强化学习的AI工具,支持端到端图像理解和思维链技术,适用于数学、物理、化学等基础科学领域。该模型可直接处理图像信息并生成推理思维链,具有优秀的字符识别能力和跨学科问题解决能力,广泛应用于教育、科研、艺术等领域。

Lingolette

Lingolette是一款利用AI技术打造的语言学习平台,专注于通过实时对话和个性化学习路径提升用户的外语口语与书面表达能力。平台支持多种语言(如英语、法语、德语等),并结合沉浸式场景、逐步指导和每日更新的内容激发学习动力。此外,它适合个人、教育机构、职场人士及企业团队使用,满足多样化的学习需求。

QVQ

QVQ是一个基于Qwen2-VL-72B的开源多模态推理模型,擅长处理文本、图像等多模态数据,具备强大的视觉理解和复杂问题解决能力。它在数学和科学领域的视觉推理任务中表现出色,但在实际应用中仍需解决语言切换、递归推理及图像细节关注等问题。QVQ可广泛应用于教育、自动驾驶、医疗图像分析、安全监控及客户服务等领域。

ChiChat

ChiChat是一款由AI技术支持的多功能智能助手平台,提供自然语言交互、文档分析、图像识别及创意图像生成等功能。其核心特性包括支持多页文档解析、多层图像识别、DALL-E图像生成以及实时搜索能力。ChiChat适用于客户服务、教育辅导、企业知识管理及个人事务处理等多种应用场景。

Poetry2Image

Poetry2Image是一个由哈尔滨工业大学提出的迭代校正框架,专门用于中文古诗词的图像生成。该工具通过自动化反馈和校正机制,提升了诗歌与图像的一致性,解决了文本到图像生成模型在处理中文古典诗歌时常见的关键元素丢失或语义混淆问题。Poetry2Image具备搜索翻译、生成初始图像、提取关键元素、图像修正及迭代优化等功能,与多种图像生成模型结合使用时,其元素完整性和语义一致性表现优异,适用于古诗词