AI

TextIn Tools

是一款免费在线OCR工具,包含文字识别、表格识别,PDF转文件等功能,识别率高,体验好,免费。

点线搜索

点线搜索是一款由零一万物开发的人工智能驱动型搜索工具,具备精准理解用户问题、全面收集网络信息、透明展示数据来源及整合重塑内容的能力。它支持多种检索模式,提供图文结合的答案展示,并能根据用户行为进行个性化推荐。适用于学术研究、职业查询、生活咨询等多个场景,助力用户提升效率并拓展视野。 ---

MVGenMaster

MVGenMaster是一款基于多视图扩散模型的工具,利用增强的3D先验技术实现新视角合成任务。它可以从单一图像生成多达100个新视图,具有高度的灵活性和泛化能力。模型结合了度量深度、相机姿态扭曲以及全注意力机制等技术,支持高效的前向传播过程,同时兼容大规模数据集。MVGenMaster在视频游戏、电影特效、虚拟现实、3D建模及建筑可视化等领域具有广泛应用前景。

DreamO

DreamO是由字节跳动与北京大学联合开发的图像定制生成框架,基于扩散变换器(DiT)模型实现多条件图像生成。支持身份、风格、背景等条件的灵活集成,具备高质量生成、条件解耦和精准控制能力。适用于虚拟试穿、风格迁移、主体驱动生成等多种场景,具备广泛的适用性和技术先进性。

VisionFM

VisionFM是一款专为眼科设计的多模态多任务视觉基础模型,通过大规模预训练支持多种眼科成像模态处理,涵盖疾病筛查、诊断、预后预测、表型细分及全身性生物标志物分析等功能。其在疾病诊断上的表现超越了大部分眼科医生,并具备强大的泛化能力和少样本学习能力。

Piggy To

Piggy Magic 是一个AI驱动的社交故事制作工具,将您的文字转化为视觉上引人注目的视频和图片,可在Instagram、TikTok、Facebook、Snapchat等社交媒体平台上分享。

anime.gf

Anime.gf 是一款基于开源技术开发的本地应用程序,支持用户创建和管理个性化虚拟角色。它利用先进的自然语言处理技术和多种大型语言模型 API,提供智能化的对话体验。主要功能涵盖角色创建、编辑与删除、多 API 接入、聊天记录管理以及响应再生成等。适用于娱乐、情感陪伴、语言学习、故事创作、教育辅助以及心理治疗等多个领域。

EMO2

EMO2是一种由阿里巴巴智能计算研究院开发的音频驱动头像视频生成技术,通过音频输入和静态人像照片生成高质量、富有表现力的动态视频。其核心技术包括音频与手部动作的协同建模、扩散模型生成视频帧,以及高精度音频同步。该工具支持多样化动作生成,适用于虚拟现实、动画制作和跨语言内容创作等场景,具备自然流畅的视觉效果和丰富的应用场景。

OpenTaskAI

​OpenTaskAI是一个创新的人才市场,专门为AI相关的自由职业者和业务需求搭建桥梁。使AI领域的自由职业者能够轻松地接触到各种业务机会。