admin

admin

这家伙很懒,什么也没写

加入时间 8年前

TA的文章

Chikka.ai

Chikka.ai

Chikka.ai 是一款基于AI语音代理的客户访谈平台,支持多语言、大规模对话,提供个性化访谈设计、自动转录与分析功能。适用于客户反馈、员工意见、产品开发等场景,帮助企业高效获取洞察,优化决策流程。
URO

URO

URO-Bench 是一个面向端到端语音对话模型的综合评估工具,支持多语言、多轮对话及副语言信息处理。它包含基础和高级两个赛道,分别涵盖16个和20个数据集,覆盖开放性问答、情感生成、多语言任务等。支持多种评估指标,提供简单易用的评估流程,并兼容多种语音对话模型。适用于智能家居、个人助理、语言学习等多个实际应用场景。
Character

Character

Character-3 是 Hedra Studio 推出的全模态 AI 视频生成工具,支持图像、文本和音频输入,生成高质量动态视频。具备全身动作捕捉、情感控制、精准对口型等功能,适用于创意视频、虚拟形象、教育、营销等多个场景。采用多模态融合与先进 AI 技术,提升视频自然度与连贯性,提高内容创作效率。
Nanobrowser

Nanobrowser

Nanobrowser 是一款开源的 Chrome 扩展工具,采用多智能体系统实现网页自动化任务,如信息提取和操作执行。用户可通过 LLM API 配置不同智能体,提升任务灵活性。支持本地运行,保障隐私安全,适用于信息收集、电商、内容创作、企业自动化和个人效率提升等多种场景。其动态调整机制增强了任务的稳定性和适应能力。
AppAgentX

AppAgentX

AppAgentX是西湖大学开发的智能GUI代理框架,通过记忆和进化机制优化手机交互效率。它能自动归纳高效操作模式,减少重复计算,支持跨应用复杂任务。基于视觉识别,无需API即可通用操作,适用于自动化任务、智能助手、企业流程等领域。在多项测试中表现优异,为智能代理技术提供新思路。
GO

GO

GO-1是智元机器人推出的首个通用具身基座模型,采用ViLLA架构,结合多模态大模型与混合专家系统,具备场景感知、动作理解和精细执行能力。支持小样本快速泛化、跨本体部署与持续进化,广泛应用于零售、制造、家庭及科研等领域,推动具身智能技术发展。
Gemini Embedding

Gemini Embedding

Gemini Embedding 是 Google 推出的文本嵌入模型,能将文本转化为高维向量以捕捉语义和上下文信息。支持超过 100 种语言,具备高效的检索、分类、聚类和相似性检测能力。其支持长文本输入和灵活的维度调整,适用于多场景应用,如智能搜索、数据分析和自然语言处理。模型基于 Gemini 训练,具有优秀的语言理解能力。
DoraCycle

DoraCycle

DoraCycle是由新加坡国立大学Show Lab开发的一种多模态生成模型,通过文本与图像间的双向循环一致性学习,实现跨模态信息转换与对齐。其核心优势在于无需大量标注数据即可完成领域适应,支持风格化设计、虚拟角色生成等多样化任务。模型采用自监督学习和梯度裁剪等技术提升训练稳定性,适用于广告、教育等多个应用场景。
Tolan

Tolan

Tolan是一款AI驱动的陪伴应用,提供个性化对话、星球互动、照片反馈及语音交流等功能,帮助用户在日常生活中获得情感支持与互动体验。其应用场景涵盖社交娱乐、创意写作、语言学习等,适用于寻求情感陪伴或趣味互动的用户。支持多平台使用,提供灵活的订阅方案。
IMAGPose

IMAGPose

IMAGPose是由南京理工大学开发的统一条件框架,用于人体姿态引导的图像生成。其核心功能包括多场景适应、细节与语义融合、灵活对齐及全局一致性保障。通过FLC、ILC和CVA模块,解决了传统方法在生成多样姿态图像时的局限性,适用于虚拟现实、影视制作、电商展示等多个领域。

微信公众账号

微信扫一扫加关注

返回
顶部