AI

Readtheirlips

Readtheirlips 是一款由 Symphonic Labs 开发的 AI 软件,主要用于通过分析视频中人物的嘴唇运动来识别和转录口语内容。它利用面部检测技术,提取并分析嘴唇的几何特征和动态变化,与训练数据进行匹配,以识别视频中人物所说的内容。该软件适用于听力受损人士、视频字幕生成、安全监控、教育和培训以及媒体和娱乐等多个场景。

Paper2Code

Paper2Code是一款由韩国科学技术院与DeepAuto.ai合作开发的AI工具,基于多Agent大语言模型,能将机器学习论文自动转化为可运行的代码仓库。它通过规划、分析和代码生成三个阶段,确保代码结构清晰且忠实于原论文内容。该工具显著提升了科研复现效率,适用于研究、教学、工业等多个领域,具有高度实用性和准确性。

BLIP3

BLIP3-o是Salesforce Research等机构推出的多模态AI模型,结合自回归与扩散模型优势,实现高效图像理解和生成。基于CLIP语义特征,支持文本与图像间的双向转换及图像编辑。采用顺序预训练策略,提升模型性能。完全开源,适用于创意设计、视觉问答、艺术生成等多种场景。

Promptim

Promptim是一款实验性的AI提示优化工具,旨在通过自动化优化循环提升AI系统在特定任务中的表现。其主要功能包括自动化提示优化、自定义评估器集成、人工反馈循环及多轮优化。Promptim支持文本生成、对话系统、机器翻译、情感分析和教育等多个应用场景,通过数据驱动的优化方法和元提示策略,帮助用户快速生成更高效的提示,显著提升AI系统的性能。

Colorize Photos

一个基于AI的在线智能转换工具。使用AI为照片着色,在几秒钟内将黑白图片转换为彩色。

Lyzr AI

Lyzr AI提供了一个强大的平台,使用户能够快速构建和部署自主的AI Agents。通过AIMS门户,用户可以轻松管理、监控AI Agents的性能,并确保它们的安全性和合规性。

KuaiMod

KuaiMod 是快手开发的多模态大模型内容审核系统,能高效识别和过滤有害及低质量视频。它结合视觉语言模型(VLM)和链式推理(CoT)技术,支持动态策略更新和强化学习,提升审核准确性。系统在离线测试中准确率达92.4%,有效降低用户举报率,优化推荐体验,助力平台内容生态健康发展。

Trickle AI

一款基于AI的零代码开发工具,用户可以通过自然语言描述需求,快速生成网页、表单和应用,支持一键部署访问,Trickle适合小商家、创业者、设计师和普通开发者。

MTVCrafter

MTVCrafter是由中国科学院深圳先进技术研究院计算机视觉与模式识别实验室、中国电信人工智能研究所等机构推出的新型人类图像动画框架,基于4D运动标记化(4DMoT)和运动感知视频扩散Transformer(MV-DiT)实现高质量动画生成。该工具直接对3D运动序列建模,支持泛化到多种角色和风格,保持身份一致性,并在TikTok基准测试中取得优异成绩。其应用场景包括数字人动画、虚拟试穿、沉浸式内

BrightHire

BrightHire是一款基于AI技术的招聘平台,提供结构化面试计划设计、自动记录与转录面试、AI驱动的面试笔记及即时反馈等功能。它可与多种现有系统无缝集成,并通过减少招聘偏见、加速决策速度来提升招聘质量和效率,同时优化候选人体验。