文本到视频生成:CogVideoX (2024) 和 CogVideo (ICLR 2023) 文本到视频生成:CogVideoX (2024) 和 CogVideo (ICLR 2023) 视频生成 2025年06月26日 0 点赞 0 评论 416 浏览
Mistral Saba Mistral Saba 是一款面向中东和南亚地区的定制化 AI 模型,具备 240 亿参数,专注于阿拉伯语及南亚语言(如泰米尔语、马拉雅拉姆语)的处理。其优势在于高效部署、低资源占用和高准确性,适合需要文化背景理解的场景。可通过微调应用于多个行业,并支持 API 和本地部署,适用于对话支持、专业领域知识生成及文化内容创作。 AI项目与工具 2025年06月12日 65 点赞 0 评论 416 浏览
飞书知识问答 飞书知识问答是一款基于AI技术的企业级知识管理工具,支持多数据源接入与实时搜索,提供结构化答案生成、智能问答、标准问答库管理等功能。支持多模态回答,兼容多种AI模型,适用于知识管理、智能客服、团队协作等场景,提升信息处理效率与准确性。 AI项目与工具 2025年06月12日 59 点赞 0 评论 416 浏览
Krisp Krisp是一款人工智能降噪工具,适用于Mac和Windows。它可以消除通话中的背景声音、噪音和回声,让用户安心。它还在每次通话结束时提供有用的见解,包括通话时间、会议见解和通话摘... Ai语音工具 1970年01月01日 0 点赞 0 评论 416 浏览
Talk AI练口语 Talk AI是一款基于AI技术的语言学习应用,支持超过60种语言,提供实时语法纠错、智能生词本、视频通话等功能。它通过模拟真实对话场景,帮助用户提升口语能力,同时提供语言考试模拟练习。无论是在日常交流、商务场景还是旅行准备中,Talk AI都能满足不同用户的需求。 AI项目与工具 2025年06月12日 66 点赞 0 评论 416 浏览
PixelFlow PixelFlow是由香港大学与Adobe联合开发的图像生成模型,支持在像素空间中直接生成高质量图像。其基于流匹配技术和多尺度生成策略,实现从低分辨率到高分辨率的逐步生成,有效降低计算成本。该模型在类别条件图像生成和文本到图像生成任务中表现优异,具备强大的语义理解和视觉表达能力。此外,PixelFlow采用端到端训练方式,支持多种ODE求解器,适用于艺术设计、内容创作、教育研究等多个领域。 AI项目与工具 2025年06月11日 100 点赞 0 评论 416 浏览
SceneXplain SceneXplain 是一个强大的图像和视频理解工具,它通过提供详细的字幕和摘要,帮助用户和企业增强视觉内容的可访问性和叙事能力。 创作工具 1970年01月01日 0 点赞 0 评论 416 浏览
Evolving Agents Evolving Agents 是一个用于构建、管理及优化 AI 代理的生产级框架,支持代理间通信与协作,并能根据语义理解和历史经验动态进化。具备智能代理进化、标准化通信协议、语义搜索、YAML 工作流定义等功能,适用于文档处理、医疗、金融、客服等场景,提升任务处理效率与效果。 AI项目与工具 2025年06月12日 100 点赞 0 评论 417 浏览