AI工具

Molmo 72B

Molmo 72B是一款由艾伦人工智能研究所推出的开源多模态AI模型,集成了图像和文本处理能力,适用于图像描述生成、视觉问答、文档解析及多模态交互等多种任务。凭借其强大的视觉编码能力和先进的模型架构,Molmo 72B在学术基准测试中表现优异,为开源AI技术的发展做出了重要贡献。

YouMind

YouMind是一款以AI为核心的内容整理与创作平台,支持从多种信息源中提取关键信息并生成创意作品。凭借Anthropic、OpenAI和Meta的顶级语言模型技术支持,它能够提供高效、稳定的服务,同时保障用户隐私安全。无论是学术研究、内容创作还是教育培训,YouMind都能显著提升用户的信息处理能力和创作效率。

MTVCrafter

MTVCrafter是由中国科学院深圳先进技术研究院计算机视觉与模式识别实验室、中国电信人工智能研究所等机构推出的新型人类图像动画框架,基于4D运动标记化(4DMoT)和运动感知视频扩散Transformer(MV-DiT)实现高质量动画生成。该工具直接对3D运动序列建模,支持泛化到多种角色和风格,保持身份一致性,并在TikTok基准测试中取得优异成绩。其应用场景包括数字人动画、虚拟试穿、沉浸式内

RelightVid

RelightVid是一款基于时序一致性扩散模型的视频重照明工具,由多所高校和研究机构联合开发。它支持通过文本提示、背景视频或HDR环境贴图对视频进行细粒度和一致的场景编辑,具备全场景和前景保留重照明功能。该模型在预训练图像照明编辑框架基础上扩展,引入时序层提升视频重照明效果,并结合真实视频与3D渲染数据生成高质量数据对。RelightVid在保持时序一致性和照明细节方面表现突出,适用于影视制作、

AutoMouser

AutoMouser是一款Chrome浏览器扩展,能够智能记录用户交互行为,并基于OpenAI GPT模型自动生成Selenium测试代码。它支持实时操作跟踪、代码结构优化、JSON日志导出等功能,适用于自动化测试脚本的快速生成与调试,提高了测试效率和可维护性。其核心优势在于简化了测试脚本的创建过程,降低了技术门槛。

讯飞译制

讯飞译制是一款基于语音识别与机器翻译技术的智能字幕制作与翻译平台,支持多语言转换与自动字幕生成,提供高精度识别、智能时间码匹配、多格式导出及配音功能,适用于短视频出海、教学视频、广告宣传等多种场景,提升内容传播效率与国际化水平。

Ai2 PaperFinder

Ai2 PaperFinder 是由艾伦人工智能研究所开发的基于大型语言模型的学术文献检索工具,支持多领域精准搜索,具备语义驱动、多Agent协同、引用网络分析等功能,能自动规划关键词、挖掘小众文献,助力研究人员快速获取高质量学术成果。

星火文档问答

讯飞星火知识库文档问答,是科大讯飞基于讯飞星火大模型和星火知识库搭建的文档问答服务,能够高效检索文档信息,准确回答专业问题。

CoGenAV

CoGenAV是一种先进的多模态学习模型,专注于音频和视觉信号的对齐与融合。通过对比特征对齐和生成文本预测的双重目标进行训练,利用同步音频、视频和文本数据,学习捕捉时间对应关系和语义信息。CoGenAV具备音频视觉语音识别、视觉语音识别、噪声环境下的语音处理、语音重建与增强、主动说话人检测等功能,适用于智能助手、视频内容分析、工业应用和医疗健康等多个场景。

Refly

Refly是一款基于“自由画布”理念的AI原生创作平台,支持多线程对话、知识库管理、上下文记忆和智能写作等功能。用户可通过其便捷的工具实现创意转化、内容优化与团队协作,适用于学术研究、内容创作及商业文档撰写等多种场景。平台强调高效、专业与个性化,助力用户提升创作效率与内容质量。