AI项目与工具

KaChiKa

KaChiKa是一款基于AI图像识别的日语学习工具,用户可通过拍照或上传图片获取相关日语词汇和句子,并配有标准发音功能。支持本地存储学习卡片,方便复习,适用于日常生活、旅行、复习及语言实践等多种场景,提升学习效率与实用性。

Gensmo

Gensmo是一款基于人工智能技术的穿搭应用,通过拍照识别和数据分析,为用户提供场景化、个性化的穿搭建议和购物指南。其功能涵盖日常穿搭、旅行规划、礼物推荐及互动拼贴画创作,旨在提升用户的时尚品味和购物体验,同时支持社区分享与交流。

豆包视觉理解模型

豆包视觉理解模型是一款集视觉识别、理解推理和复杂逻辑计算于一体的先进AI工具。它具备强大的视觉定位能力,支持多目标、小目标和3D定位,并能识别物体的类别、形状、纹理等属性,理解物体间的关系和场景含义。此外,模型在视频理解方面表现出色,能够进行记忆、总结、速度感知和长视频分析。凭借其高效性和成本优势,该模型广泛应用于图片问答、医疗影像分析、教育科研、电商零售及内容审核等领域。

DupDub

DupDub是一款由出门问问开发的AI内容生成平台,集成了AI写作、文本转语音、视频编辑等多项功能,支持70多种语言和500多种真实语音效果。它通过简化创作流程,帮助内容创作者快速生成高质量的视频、文本和音频内容,适用于营销、教育、无障碍辅助等多种应用场景,有效提升工作效率与内容影响力。

OmniVision

OmniVision是一款面向边缘设备的紧凑型多模态AI模型,参数量为968M。它基于LLaVA架构优化,能够处理视觉与文本输入,显著降低计算延迟和成本。OmniVision支持视觉问答、图像描述等功能,广泛应用于内容审核、智能助手、视觉搜索等领域。

Finalle

Finalle是一款基于人工智能技术构建的金融分析平台,专为现代投资者设计。它通过实时数据分析、新闻事件集成以及财报解读等功能,帮助用户深入了解市场动态和股票表现。此外,Finalle还兼具投资者教育属性,提供从基础入门到进阶应用的学习资源。其核心优势在于高效的数据处理能力、简洁的操作体验以及对主流美股的深度覆盖。

Poster Studio

Poster Studio是一款专为社交媒体广告设计的人工智能工具,支持用户通过简单操作生成高质量广告创意。它具备多语言支持、多平台适配以及高ROI优化等特点,同时提供灵活的编辑功能和丰富的模板资源,广泛应用于品牌推广、产品发布、电商促销等领域。

Tensor.Art

Tensor.Art 是一款基于 AI 技术的图像生成平台,支持用户通过文字描述生成高质量图像。平台提供多种模型类型,支持模型共享、在线运行及训练,并拥有 ControlNet、图像到图像等功能。Tensor.Art 构建了活跃的创作者社区,适用于艺术创作、广告设计、教育等多个领域,为用户提供便捷高效的图像生成解决方案。

Kotaemon

Kotaemon 是一款基于RAG技术的开源工具,支持用户通过自然语言与文档进行互动,从而实现高效的信息检索和理解。它支持多种语言模型,包括OpenAI、Azure OpenAI和Cohere等,提供简易的安装脚本。Kotaemon 还支持多用户协作、文档管理和复杂的推理方法,并允许用户自定义UI元素。其主要功能包括基于RAG技术的问答系统、多语言模型支持、文档管理、混合RAG管道、多模式问答支持

EmotiVoice

EmotiVoice是网易有道推出的开源文本到语音系统,支持中英文及2000+音色,能根据提示生成带情感的语音。具备情感合成、语音克隆、多语言支持等功能,提供Web界面和API接口,适用于有声读物、智能助手、教育、客服等场景,技术上支持高效部署与模型微调。