Step R Step R-mini是一款由阶跃星辰推出的推理模型,具备主动规划、尝试与反思能力,适用于数学、逻辑推理、代码开发及文学创作等多种场景。模型基于慢思考机制,支持深度推理与多步骤验证,表现优异。其技术特点包括强化学习、数据质量优化、测试时计算扩展及模型规模增长,实现文理兼修,广泛应用于教育、科研、企业办公等领域。 AI项目与工具 2025年06月12日 43 点赞 0 评论 217 浏览
GenMAC GenMAC是一款基于多代理协作的迭代框架,旨在解决文本到视频生成中的复杂场景生成问题。它通过任务分解为设计、生成和重新设计三阶段,结合验证、建议、修正和输出结构化子任务,利用自适应自路由机制优化视频生成效果。该工具可应用于电影制作、游戏开发、广告设计、教育培训和新闻报道等多个领域,显著提升视频生成的效率和质量。 AI项目与工具 2025年06月12日 42 点赞 0 评论 217 浏览
Stablecog Stablecog 是一款基于人工智能技术的开源图像生成工具,能够根据文本描述或现有图片生成逼真的艺术作品。它支持多种艺术风格,具备图像编辑和调整功能,适用于艺术创作、设计、社交媒体内容制作等多个领域。 AI项目与工具 2025年06月12日 84 点赞 0 评论 218 浏览
Klee Klee是一款本地运行的AI桌面应用,专注于数据安全与隐私保护,所有操作均在用户设备上完成。它集成了RAG技术、开源AI模型,并支持笔记管理、文件分析、团队协作等功能。适用于个人知识管理、软件测试、数据分析及自然语言处理等多种场景,尤其适合注重隐私和高效工作的用户。 AI项目与工具 2025年06月12日 90 点赞 0 评论 218 浏览
Eagle 2.5 Eagle 2.5 是一款由英伟达开发的视觉语言模型,专注于长上下文多模态学习,具备处理高分辨率图像和长视频序列的能力。其参数规模为 8B,但性能接近更大模型。采用信息优先采样和渐进式后训练策略,提升模型稳定性与适应性。支持多样任务,适用于视频分析、图像处理、内容创作及教育等多个领域。 AI项目与工具 2025年06月11日 59 点赞 0 评论 218 浏览
音刻 Inkr 是一款高效的 AI 语音转录工具,支持超过 100 种语言,具备快速转录、多语言支持、说话人识别、高准确率等功能。其“FLASH”模式可在几秒内完成转录,适用于会议记录、采访整理、字幕制作及学习辅助等多种场景,提升信息处理效率。 AI项目与工具 2025年06月11日 47 点赞 0 评论 218 浏览
LongLLaVA LongLLaVA是由香港中文大学(深圳)研究团队开发的多模态大型语言模型,结合Mamba和Transformer模块,利用2D池化技术压缩图像token,大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异,特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化,支持多种多模态输入处理,广泛应用于视频分析、医学影像诊断、环境监测等领域。 AI项目与工具 2025年06月12日 67 点赞 0 评论 218 浏览
Interview Coder Interview Coder 是一款面向技术面试的 AI 工具,支持多平台和多种编程语言,能通过截图自动解析题目并生成代码解决方案,提供详细注释与优化建议,适用于在线编程面试及远程视频面试场景,提高面试效率和准确性。 AI项目与工具 2025年06月11日 53 点赞 0 评论 218 浏览
VideoVAE+ VideoVAE+是一种由香港科技大学研发的跨模态视频变分自编码器,具备时空分离压缩和文本指导功能。它通过分离空间与时间信息处理,有效减少运动伪影,同时利用文本嵌入增强细节重建能力。VideoVAE+在视频重建质量上超越现有模型,支持高保真与跨模态重建,适用于视频压缩、影视后期制作及在线教育等多个领域。 AI项目与工具 2025年06月12日 45 点赞 0 评论 218 浏览
Pika 2.2 Pika 2.2 是一款基于深度学习的AI视频生成工具,支持文本和图片输入,可生成最高10秒、1080p分辨率的高质量视频。其核心功能包括关键帧过渡技术(Pikaframes)和电影画幅比例支持,提升视频连贯性与专业感。适用于内容创作、广告制作、影视及教育等多个领域,操作简便,适合各类用户快速生成创意视频。 AI项目与工具 2025年06月12日 34 点赞 0 评论 218 浏览