admin的文章

Chikka.ai

Chikka.ai 是一款基于AI语音代理的客户访谈平台，支持多语言、大规模对话，提供个性化访谈设计、自动转录与分析功能。适用于客户反馈、员工意见、产品开发等场景，帮助企业高效获取洞察，优化决策流程。

488 0

URO

URO-Bench 是一个面向端到端语音对话模型的综合评估工具，支持多语言、多轮对话及副语言信息处理。它包含基础和高级两个赛道，分别涵盖16个和20个数据集，覆盖开放性问答、情感生成、多语言任务等。支持多种评估指标，提供简单易用的评估流程，并兼容多种语音对话模型。适用于智能家居、个人助理、语言学习等多个实际应用场景。

541 0

Character

Character-3 是 Hedra Studio 推出的全模态 AI 视频生成工具，支持图像、文本和音频输入，生成高质量动态视频。具备全身动作捕捉、情感控制、精准对口型等功能，适用于创意视频、虚拟形象、教育、营销等多个场景。采用多模态融合与先进 AI 技术，提升视频自然度与连贯性，提高内容创作效率。

527 0

Nanobrowser

Nanobrowser 是一款开源的 Chrome 扩展工具，采用多智能体系统实现网页自动化任务，如信息提取和操作执行。用户可通过 LLM API 配置不同智能体，提升任务灵活性。支持本地运行，保障隐私安全，适用于信息收集、电商、内容创作、企业自动化和个人效率提升等多种场景。其动态调整机制增强了任务的稳定性和适应能力。

666 0

AppAgentX

AppAgentX是西湖大学开发的智能GUI代理框架，通过记忆和进化机制优化手机交互效率。它能自动归纳高效操作模式，减少重复计算，支持跨应用复杂任务。基于视觉识别，无需API即可通用操作，适用于自动化任务、智能助手、企业流程等领域。在多项测试中表现优异，为智能代理技术提供新思路。

606 0

GO

GO-1是智元机器人推出的首个通用具身基座模型，采用ViLLA架构，结合多模态大模型与混合专家系统，具备场景感知、动作理解和精细执行能力。支持小样本快速泛化、跨本体部署与持续进化，广泛应用于零售、制造、家庭及科研等领域，推动具身智能技术发展。

585 0

Gemini Embedding

Gemini Embedding 是 Google 推出的文本嵌入模型，能将文本转化为高维向量以捕捉语义和上下文信息。支持超过 100 种语言，具备高效的检索、分类、聚类和相似性检测能力。其支持长文本输入和灵活的维度调整，适用于多场景应用，如智能搜索、数据分析和自然语言处理。模型基于 Gemini 训练，具有优秀的语言理解能力。

565 0

DoraCycle

DoraCycle是由新加坡国立大学Show Lab开发的一种多模态生成模型，通过文本与图像间的双向循环一致性学习，实现跨模态信息转换与对齐。其核心优势在于无需大量标注数据即可完成领域适应，支持风格化设计、虚拟角色生成等多样化任务。模型采用自监督学习和梯度裁剪等技术提升训练稳定性，适用于广告、教育等多个应用场景。

567 0