学习

布朗大学

布朗大学(Brown University)创立于1764年,是全美第七古老的大学,坐落在美国罗得岛州首府普罗维登斯市。是一所私立研究型大学,八所常春藤盟校之一。 布朗大学是全美录取率最低...

VideoGrain

VideoGrain是由悉尼科技大学与浙江大学联合研发的零样本多粒度视频编辑框架,支持类别级、实例级和部件级的精细化视频修改。它通过调节时空交叉注意力和自注意力机制,提升文本提示对目标区域的控制能力,确保时间一致性与特征分离,显著优于现有T2I和T2V方法。该工具无需额外参数调整,具备高效计算性能,适用于影视制作、广告营销、内容创作等多个领域。

Leffa

Leffa是一种基于注意力机制的可控人物图像生成框架,通过流场学习精确控制人物的外观和姿势。其核心技术包括正则化损失函数、空间一致性及模型无关性,能够在保持细节的同时提升图像质量。Leffa广泛应用于虚拟试穿、增强现实、游戏开发及影视后期制作等领域,展现出卓越的性能与灵活性。

AutoConsis

AutoConsis是一款基于深度学习和大型语言模型的UI内容一致性智能检测工具,能够自动识别和提取界面中的关键数据,并对数据一致性进行高效校验。它支持多业务场景适配,具备高泛化性和高置信度,广泛应用于电商、金融、旅游等多个领域,助力提升用户体验和系统可靠性。

VideoWorld

VideoWorld是由北京交通大学、中国科学技术大学与字节跳动合作开发的深度生成模型,能够通过未标注视频数据学习复杂知识,包括规则、推理和规划能力。其核心技术包括自回归视频生成、潜在动态模型(LDM)和逆动态模型(IDM),支持长期推理和跨环境泛化。该模型在围棋和机器人控制任务中表现优异,且具备向自动驾驶、智能监控等场景扩展的潜力。

短剧搜

一个专注于短剧搜索的引擎,提供丰富的网盘资源搜索功能,支持百度网盘、阿里云盘、夸克云盘等网盘资源的全文检索,短剧搜索,影视搜索。

HumanDiT

HumanDiT是一种由浙江大学与字节跳动联合开发的高保真人体视频生成框架,基于扩散变换器(DiT)实现姿态引导的视频生成。它支持长序列、多分辨率视频生成,并通过关键点扩散变换器(Keypoint-DiT)确保动作的连贯性与自然性。引入前缀潜在参考策略以保持个性化特征,结合姿态适配器和细化模块提升细节质量。适用于虚拟人、动画制作、沉浸式体验及视频续写等多种场景。

Mellum

Mellum 是 JetBrains 推出的一款专为开发者设计的大型语言模型(LLM),通过深度集成 JetBrains IDE,提供低延迟、高精度的代码补全服务,支持多种编程语言,显著提升开发效率。其训练数据仅限于公开可用且许可宽松的代码,保障用户隐私。

Offline Chat

Offline Chat是一款专为iOS设备设计的离线AI聊天应用程序。它支持完全在本地运行,无需网络连接,确保用户数据的安全和隐私。用户可以加载和查询私人文档,并且可以选择不同性能的AI模型。这款应用适用于商务、学习和旅行等多种场景,是注重隐私保护和便携性的理想助手。

Saner.AI

Saner.AI是一款以人工智能驱动的知识管理工具,旨在提高个人和团队的工作效率。其主要功能包括即时笔记记录、智能信息导入、专注模式、多视角信息查找、PDF与笔记摘要生成,以及标签推荐和相似笔记连接等。通过这些功能,Saner.AI能够帮助用户高效整理信息、激发创意,并提升专注力。它适用于多种场景,包括个人知识管理、团队协作、学习辅助、项目管理和日常任务规划,同时注重数据安全与隐私保护。