学习 - 智狐AI导航

Eagle

Eagle是一个由英伟达开发的多模态大模型，专长于处理高分辨率图像，提高视觉问答和文档理解能力。该模型采用多专家视觉编码器架构，通过简单的特征融合策略实现图像内容的深入理解。Eagle模型已开源，适用于多个行业，具有高分辨率图像处理、多模态理解、多专家视觉编码器、特征融合策略和预对齐训练等特点。

AI项目与工具 2025年06月12日 38 点赞 0 评论 471 浏览

CustomVideoX

CustomVideoX是一种基于视频扩散变换器的个性化视频生成框架，能够根据参考图像和文本描述生成高质量视频。其核心技术包括3D参考注意力机制、时间感知注意力偏差（TAB）和实体区域感知增强（ERAE），有效提升视频的时间连贯性和语义一致性。支持多种应用场景，如艺术设计、广告营销、影视制作等，具备高效、精准和可扩展的特点。

AI项目与工具 2025年06月12日 98 点赞 0 评论 471 浏览

AI课代表-视频总结

专门为视频站打造的AI总结助手

Ai办公效率 1970年01月01日 0 点赞 0 评论 472 浏览

Tough Tongue AI 2.0

Tough Tongue AI 2.0 是一款多模态对话训练工具，适用于面试、职场沟通、销售谈判等多种场景。用户可自定义AI角色与语气，通过视频和音频反馈练习非语言沟通技巧，并获得个性化反馈以提升表达能力。支持多语言使用，可无限重试，便于反复练习。具备嵌入功能，方便集成到其他平台。

AI项目与工具 2025年06月12日 61 点赞 0 评论 473 浏览

加利福尼亚大学洛杉矶分校

加利福尼亚大学洛杉矶分校（University of California, Los Angeles，简称：UCLA），是位于美国洛杉矶的公立研究型大学，是环太平洋大学联盟和国际公立大学论坛成员，被誉为“公...

教育学习 1970年01月01日 0 点赞 0 评论 473 浏览

WriteAI.Tech

创建独特而吸引人的内容，以提高转化率和销售额，并生成令人惊叹的图像，以提高参与度。

AI写作对话 1970年01月01日 0 点赞 0 评论 474 浏览

MOFA

MOFA-Video是由腾讯AI实验室和东京大学研究人员开发的开源图像生成视频模型。该工具通过生成运动场适配器对图像进行动画处理，能够通过稀疏控制信号（如手动轨迹、面部关键点序列或音频）实现对视频生成过程中动作的精准控制。MOFA-Video支持零样本学习，能够将多种控制信号组合使用，生成复杂的动画效果，并能生成较长的视频片段。 ---

AI项目与工具 2025年06月12日 22 点赞 0 评论 474 浏览

Manga Image Translator

Manga Image Translator 是一个开源的漫画图片文字翻译工具，基于 OCR 和机器翻译技术，实现对漫画和图片中文字的自动识别与翻译。它支持多语言翻译，包括日文、中文、英文和韩文，并具备图像合成能力，保持原图风格。工具提供批量处理和在线/离线翻译功能，适用于漫画爱好者、语言学习者以及出版商等用户群体。

AI项目与工具 2025年06月12日 16 点赞 0 评论 474 浏览

H

H-Optimus-0是由法国公司Bioptimus推出的全球最大的开源病理学AI基础模型，拥有11亿参数，基于超过50万张组织病理学切片训练，涵盖多种人体组织。该模型在癌症识别、基因异常检测、组织分类及生存分析等方面表现优异，具备强大的特征提取能力。作为开源工具，H-Optimus-0可促进病理研究与临床应用的协同创新。

AI项目与工具 2025年06月12日 75 点赞 0 评论 474 浏览

西安交通大学人工智能学院

我们的使命：让我们拥有适应、改变和创造未来世界的人工智能

教育学习 1970年01月01日 0 点赞 0 评论 474 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期