ExVideo ExVideo是一种视频合成模型后调优技术,能够生成长达128帧的连贯视频,同时保持原始模型的生成能力。该技术通过优化3D卷积、时间注意力和位置嵌入等模块,使模型能够处理更长时间跨度的内容。ExVideo的核心优势在于其高效的后调优策略,减少计算资源需求,保持视频质量,适用于计算资源有限的情况。 AI项目与工具 2025年06月12日 57 点赞 0 评论 637 浏览
s1 S1是由斯坦福大学和华盛顿大学联合开发的低成本、高性能AI推理模型,采用知识蒸馏技术从大型模型中提取推理能力。通过1000个高质量问题训练,成本低于50美元,训练时间短于30分钟。S1在数学和编程领域表现卓越,支持测试时扩展技术以优化推理效果,并已在GitHub开源,适用于科学问题解决、智能辅导、自动问答等多种场景。 AI项目与工具 2025年06月12日 33 点赞 0 评论 637 浏览
万相首尾帧模型 万相首尾帧模型(Wan2.1-FLF2V-14B)是一款开源视频生成工具,基于DiT架构和交叉注意力机制,可根据用户提供的首帧和尾帧图像生成高质量、流畅的过渡视频。支持多种风格和特效,适用于创意视频制作、影视特效、广告营销等多个场景。模型具备细节复刻、动作自然、指令控制等功能,且提供GitHub和HuggingFace开源资源供用户使用。 AI项目与工具 2025年06月11日 100 点赞 0 评论 637 浏览
HMoE HMoE(混合异构专家模型)是腾讯混元团队提出的一种新型神经网络架构,旨在提升大型语言模型的性能和计算效率。通过引入不同规模的专家来处理不同复杂度的输入数据,HMoE增强了模型的专业化程度,并采用了新的训练目标和策略,如P-Penalty Loss,以提高参数利用率和计算效率。HMoE在多个预训练评估基准上表现出色,适用于自然语言处理、内容推荐、语音识别、图像和视频分析以及多模态学习等领域。 AI项目与工具 2025年06月12日 90 点赞 0 评论 637 浏览
书生·万象InternVL 2.5 书生·万象InternVL 2.5是一款开源多模态大型语言模型,基于InternVL 2.0升级而来。它涵盖了从1B到78B不同规模的模型,支持多种应用场景,包括图像和视频分析、视觉问答、文档理解和信息检索等。InternVL 2.5在多模态理解基准上表现优异,性能超越部分商业模型,并通过链式思考技术提升多模态推理能力。 AI项目与工具 2025年06月12日 100 点赞 0 评论 637 浏览
ChatHub 一个创新的浏览器扩展插件和应用,ChatHub设计的目的是为了让用户能够在一个统一的界面中与多个聊天机器人进行交互。 AI写作对话 2025年06月05日 98 点赞 0 评论 637 浏览
Nemotron Nemotron-Mini-4B-Instruct是一款由英伟达开发的小型开源语言模型,针对角色扮演、检索增强生成(RAG)及函数调用任务进行了优化。模型基于Transformer架构,利用蒸馏、剪枝和量化技术提升运行效率与设备端适配能力,适用于实时交互场景,如游戏NPC对话或虚拟助手交互。其快速响应特性使其在客户服务、教育软件及内容创作领域也展现出巨大潜力。 AI项目与工具 2025年06月12日 46 点赞 0 评论 638 浏览
Merlin AI 一个基于OpenAI的ChatGPT技术的浏览器扩展,Merlin AI能够在用户的浏览器上提供一键访问ChatGPT、GPT-4、Claude和Llama等高级语言模型的功能。 AI写作对话 2025年06月05日 82 点赞 0 评论 638 浏览
Diffutoon Diffutoon是一款基于扩散模型的AI框架,旨在将现实风格的视频转换为动漫风格。该框架支持高分辨率视频处理,能够实现风格化、一致性增强、结构引导和自动着色等功能。此外,Diffutoon具备内容编辑功能,用户可通过文本提示调整视频细节,确保视觉效果和内容的一致性。 AI项目与工具 2025年06月12日 45 点赞 0 评论 638 浏览
提示精灵小富贵 一个旨在简化并增强为AI模型创建和优化提示词(Prompts)过程的开源项目,会帮你写Prompt提示词的GPTs应用。 GPTs应用 2025年06月05日 27 点赞 0 评论 639 浏览