数据

EMOVA

EMOVA是一款由多所高校与企业联合研发的多模态全能型AI助手,具备处理图像、文本和语音的能力,支持情感化语音对话,并通过轻量级情感控制模块增强了人机交互的自然性。其核心技术包括连续视觉编码器、语义-声学分离的语音分词器及全模态对齐机制,广泛应用于客户服务、教育辅助、智能家居控制等多个领域。

Rodin

Rodin是一款由影眸科技开发的AI驱动3D生成工具,专注于快速生成高质量的3D模型。它支持文本提示和图片输入生成3D资产,具备多视图融合、模型调整及材质生成等功能,适用于游戏开发、角色建模、虚拟现实等多种场景,同时兼顾生成效率与细节表现,但需进一步优化精度与数据集适应性。

Index

Index-AniSora是由哔哩哔哩开发的动漫视频生成模型,支持多种动画风格的生成,涵盖番剧、国创、VTuber等内容。其核心技术包括扩散模型、时空掩码模块和Transformer架构,具备图像到视频生成、帧插值、局部引导等能力。模型提供高质量数据集,适用于动画制作、创意验证、教育及营销等多个领域。

光圈智播

一款专为抖音等直播平台设计的智能中控工具,光圈智播提供自动商品弹窗、自动发评、自动评论置顶、自动补库存等功能,支持中控台一键改价和库存调整。

Emote

Emote是一款基于AI技术的智能笔记工具,支持实时语音转录、情感分析及关键词提取等功能。它能帮助用户记录生活、管理时间、分析消费习惯,并提供私人笔友服务以实现情感支持。同时,Emote允许用户自定义笔记本和标签,满足个性化需求。

PaliGemma 2

PaliGemma 2是一款由Google DeepMind研发的视觉语言模型(VLM),结合了SigLIP-So400m视觉编码器与Gemma 2语言模型,支持多种分辨率的图像处理。该模型具备强大的知识迁移能力和出色的学术任务表现,在OCR、音乐乐谱识别以及医学图像报告生成等方面实现了技术突破。它能够处理多模态任务,包括图像字幕生成、视觉推理等,并支持量化和CPU推理以提高计算效率。

讯飞智检

讯飞智检是科大讯飞旗下开放平台推出的一款人工智能写作、校对/合规审查的智能产品,可帮助用户进行AI智能文本纠错,支持对纯文本、Word、图片、音频、视频进行批量审查。在节省人...

StreamBridge

StreamBridge是一款由苹果与复旦大学联合开发的端侧视频大语言模型框架,支持实时视频流的理解与交互。通过内存缓冲区和轮次衰减压缩策略,实现长上下文处理与主动响应。项目配套发布Stream-IT数据集,包含60万样本,适用于多种视频理解任务,展现出在视频交互、自动驾驶、智能监控等领域的应用前景。

谷歌趋势

一个由谷歌提供的免费分析工具,谷歌趋势允许用户搜索和比较关键词的趋势。它通过分析全球搜索数据,帮助用户了解不同地区和时间段的搜索热度。

老师帮

老师帮是一款专为教师设计的AI智能工具平台,集教案生成、课件制作、作业批改、教学计划撰写等功能于一体,提升教学效率与质量。支持跨学科设计、文本翻译、课堂互动、数据分析等,满足教师多样化需求。平台操作便捷,适用于教学准备、资源获取、课堂管理等多个场景,助力教师专业发展。