VideoLLaMB VideoLLaMB 是一个创新的长视频理解框架,通过引入记忆桥接层和递归记忆令牌来处理视频数据,确保在分析过程中不会丢失关键的视觉信息。该模型专为理解长时间视频内容而设计,能够保持语义上的连续性,并在多种任务中表现出色,例如视频问答、自我中心规划和流式字幕生成。VideoLLaMB 能够有效处理视频长度的增加,同时保持高性能和成本效益,适用于学术研究和实际应用。 --- AI项目与工具 2025年06月12日 39 点赞 0 评论 743 浏览
WebSSL WebSSL是由Meta和纽约大学等机构开发的视觉自监督学习模型,基于大规模网络图像数据训练,无需语言监督即可学习有效视觉表示。其包含多个变体,参数规模从3亿到70亿不等,在多模态任务如视觉问答、OCR和图表理解中表现出色。通过筛选含文本图像数据,显著提升特定任务性能。模型具备良好的扩展性,适用于智能客服、文档处理、医疗影像分析等多个领域。 AI项目与工具 2025年06月11日 92 点赞 0 评论 744 浏览
紫东太初大模型 紫东太初,中科院自动化所和武汉人工智能研究院推出新一代大模型,从三模态走向全模态,支持多轮问答、文本创作、图像生成、3D理解、信号分析等全面问答任务,拥有更强的认知、理解、创作能力,带来全新互动体验。 Ai平台模型 2025年06月05日 79 点赞 0 评论 750 浏览
百度AI搜 百度AI搜是一款基于文心大模型构建的桌面端AI搜索引擎,融合了百度多领域的资源与技术,提供智能创作、画图修图、AI阅读及精选智能体等功能。它支持文档阅读、图片处理、代码助手以及法律咨询等多样化应用,适用于学习、工作和生活中的多种场景,助力用户高效获取信息与创造价值。 AI项目与工具 2025年06月12日 56 点赞 0 评论 751 浏览
HealthGPT HealthGPT是由多家高校与企业联合开发的医学视觉语言模型,支持医学图像分析、视觉问答、文本生成及多模态融合等任务。其核心技术包括异构低秩适应(H-LoRA)、分层视觉感知(HVP)和三阶段学习策略(TLS),可高效处理复杂医疗数据。模型适用于医学诊断、教育、研究及健康管理等多个场景,具有良好的适应性和实用性。 AI项目与工具 2025年06月12日 80 点赞 0 评论 753 浏览
NewsBang NewsBang是一款基于AI技术的新闻应用,提供无偏见、深度的新闻洞察。通过整合多源信息生成简洁摘要,并支持实时问答、语音播放及个性化推荐等功能,帮助用户高效获取关键信息。适用于忙碌人群、新闻爱好者及投资者等,满足多样化信息需求。 AI项目与工具 2025年06月12日 19 点赞 0 评论 757 浏览
元象大模型XChat 元象大模型XChat是元象XVERSE推出的高性能AI产品,它通过自研技术,能够满足不同复杂度任务的需求,并在中文领域表现突出。 Ai平台模型 1970年01月01日 0 点赞 0 评论 759 浏览
3MinTop 3MinTop 是一款基于人工智能的阅读辅助工具,可将书籍内容提炼为3分钟精华摘要,帮助用户高效掌握核心信息。支持智能问答、多语言翻译及思维导图生成,适用于学生、专业人士、阅读新手等各类用户。通过科学的学习激励机制,助力用户建立持续阅读习惯,提升学习效率。 AI项目与工具 2025年06月12日 49 点赞 0 评论 759 浏览