怎么把扫描的图片压缩到最小(怎么把图片压缩到100k以内)

懵懂先生 投稿文章怎么把扫描的图片压缩到最小(怎么把图片压缩到100k以内)已关闭评论83阅读模式

文章源自略懂百科-http://wswcn.cn/80243.html

选自arXiv文章源自略懂百科-http://wswcn.cn/80243.html

作者:Laura Downs等文章源自略懂百科-http://wswcn.cn/80243.html

机器之心编译文章源自略懂百科-http://wswcn.cn/80243.html

编辑:蛋酱、泽南文章源自略懂百科-http://wswcn.cn/80243.html

谷歌的研究者提出了 Google Scanned Objects (GSO) 数据集,这是一个由超过 1000 个 3D 扫描的家用物品组成的精选集。文章源自略懂百科-http://wswcn.cn/80243.html

近年来,深度学习技术使得计算机视觉和机器人领域的许多进展成为可能,但训练深度模型需要各种各样的输入,以泛化到新的场景。文章源自略懂百科-http://wswcn.cn/80243.html

此前,计算机视觉领域已经利用网页抓取技术收集了数百万个主题的数据集,包括 ImageNet、Open Image、Youtube-8M、COCO 等。然而,给这些数据集贴标签仍是一个劳动密集型工作,标签错误可能会影响到对技术进步的感知,而且这种策略也很难推广至 3D 或真实世界的机器人数据上。与图像不同的是,目前网络上并没有大规模、高质量的 3D 场景,而从真实世界收集这类数据又极具挑战性。此外,人工标注员也很难从图像中提取 3D 几何特性。文章源自略懂百科-http://wswcn.cn/80243.html

一般来说,使用 Gazebo、Bullet、MuJoCo、Unity 等工具对机器人和环境进行仿真可以减轻上述限制。但是,仿真毕竟不完全是真实世界,即使一个场景是直接通过对真实环境的 3D 扫描建立起来的,扫描中的离散对象也会像固定的背景物一样,不会像真实世界的对象那样对输入做出回应。文章源自略懂百科-http://wswcn.cn/80243.html

因此,关键问题在于提供一个高质量的 3D 对象模型库,这些模型可以整合到物理和视觉建模中,为深度学习提供所需的多样性。文章源自略懂百科-http://wswcn.cn/80243.html

为了解决这个问题,谷歌的研究者提出了 Google Scanned Objects (GSO) 数据集,这是一个由超过 1000 个 3D 扫描家用物品组成的精选集,可用于 Ignition Gazebo、Bullet 模拟器和其他可以读取 SDF 模型格式的工具。文章源自略懂百科-http://wswcn.cn/80243.html

在一篇论文中,研究者介绍了该数据集的收集、管理、扩展等内容。文章源自略懂百科-http://wswcn.cn/80243.html

论文链接:https://arxiv.org/pdf/2204.11918.pdf文章源自略懂百科-http://wswcn.cn/80243.html

据不完全统计,GSO 数据集已经在计算机视觉、计算机图形学、机器人操作、机器人导航和 3D 形状处理等 10 个项目的 12 篇论文中得到应用:文章源自略懂百科-http://wswcn.cn/80243.html

该研究贡献主要有几点:文章源自略懂百科-http://wswcn.cn/80243.html

提出 Google Scanned Objects 数据集;3D 扫描 pipeline 设计;3D 扫描管理和发布过程;该数据集在研究领域中的影响。文章源自略懂百科-http://wswcn.cn/80243.html

数据集的创建文章源自略懂百科-http://wswcn.cn/80243.html

GSO 数据集起源于 2011 年谷歌的云机器人计划,目的是让机器人基于普通家用物品的高保真 3D 模型,能够在自己的环境中识别和抓取物体。文章源自略懂百科-http://wswcn.cn/80243.html

然而,除了物体识别和机器人抓取之外,3D 模型还有很多用途,包括用于物理模拟的场景构建和用于终端用户应用的 3D 物体可视化。因此,谷歌研究院发起了一个项目,将 3D 体验大规模引入谷歌,以低于传统商业级产品摄影的成本收集大量家用物品的 3D 扫描图像。文章源自略懂百科-http://wswcn.cn/80243.html

这是一项端到端的工程,包括物体获取、新颖的 3D 扫描硬件、高效的 3D 扫描软件、快速 3D 渲染的质量保障、网络与移动浏览器,以及人机交互研究。文章源自略懂百科-http://wswcn.cn/80243.html

在收集数据之后,研究者构建了一个 pipeline,让这些数据能以各种格式使用。文章源自略懂百科-http://wswcn.cn/80243.html

3D 扫描 pipeline文章源自略懂百科-http://wswcn.cn/80243.html

即使限于家用物品的领域,3D 扫描也会带来独特的挑战,包括高效的物理扫描设置、目标照明、相机可靠性、扫描仪性能、配色、纹理渲染,以及处理光学上不一致的材料,比如近白色、有光泽或透明的表面。文章源自略懂百科-http://wswcn.cn/80243.html

专用的 3D 扫描硬件是劳动密集型的,性价比不高。为了进行大规模扫描,还需要一些更具可用性和可靠性的工具。文章源自略懂百科-http://wswcn.cn/80243.html

因此,研究者设计了自己的专用扫描硬件和软件(图 2),能够在 10 分钟内扫描物体并生成高分辨率模型。控制光线的物理外壳(图 2b)使用两台机器视觉相机和一台投影仪进行结构光扫描,捕捉 3D 几何图形,并使用单独的单反高分辨率相机以产品友好的光线捕捉纹理。文章源自略懂百科-http://wswcn.cn/80243.html

项目第一年结束的时候能够做到每周超过 400 次扫描,过程中,研究团队共获得了 100K 份 360 度照片旋转和 10k 份完全 3D 扫描的独特对象。文章源自略懂百科-http://wswcn.cn/80243.html

图 2。文章源自略懂百科-http://wswcn.cn/80243.html

图 3:作为校准过程的扫描。(a) 校正模式使 2D pipeline 能够精确对齐相机。(b) 计算机控制的投影仪为 3D 扫描物体创造了类似的图案。(c) 合适的模式能够以亚像素精度探测位置。(d) 提取扫描物体的完整 3D 形状。文章源自略懂百科-http://wswcn.cn/80243.html

图 4:扫描的物品需要通过质量检查。(a) 许多物品被捕获为高质量的封闭流形 mesh。(b) 有的物体很少产生无效的 mesh,但有时会出现变形。文章源自略懂百科-http://wswcn.cn/80243.html

仿真模型转换文章源自略懂百科-http://wswcn.cn/80243.html

这些原始的扫描模型使用协议缓冲元数据、非常高分辨率的可视化、不适合模拟的格式。对象的一些物理属性,比如质量,会被捕获,但诸如摩擦之类的表面属性在元数据中则没有表示。文章源自略懂百科-http://wswcn.cn/80243.html

为了让这些扫描的模型能够在仿真系统中使用,每个模型都通过一个 pipeline 进行下列步骤:文章源自略懂百科-http://wswcn.cn/80243.html

过滤无效对象。分配对象名称。验证对象 mesh。计算物理属性。构造碰撞体积。减小模型尺寸。创建 SDF 模型。创建缩略图。打包模型。文章源自略懂百科-http://wswcn.cn/80243.html

数据集属性文章源自略懂百科-http://wswcn.cn/80243.html

组成文章源自略懂百科-http://wswcn.cn/80243.html

GSO 数据集包含 1030 个扫描对象和相关的元数据,总计 13GB,根据 CCBY 4.0 License 授权。表 III.1 分解了数据集中的模型类别。文章源自略懂百科-http://wswcn.cn/80243.html

表 III.1文章源自略懂百科-http://wswcn.cn/80243.html

优势文章源自略懂百科-http://wswcn.cn/80243.html

自动化 pipeline 可以快速生成大量模型,而无需手工处理。因为这些模型是扫描的,而不是手工建模的,所以它们是真实的,而不是理想中的,这减少了将学习从模拟转移到真实世界的困难。文章源自略懂百科-http://wswcn.cn/80243.html

扫描仪的玻璃平台可以从各个方面扫描模型,包括底座,不像其他扫描仪有不透明的平台。类似地,从环境中提取的模型通常缺少像底座这样起到衔接作用的遮挡区域。文章源自略懂百科-http://wswcn.cn/80243.html

因为该扫描仪根据投影图案而不是深度照相机数据重建表面形状,所以得到的 mesh 具有高保真度。光滑的表面是平滑的,轮廓边缘是准确的 (图 5)。相比之下,RGB-D 数据得到的 mesh,可能出现斑驳和不规则,特别是在轮廓上。文章源自略懂百科-http://wswcn.cn/80243.html

图5文章源自略懂百科-http://wswcn.cn/80243.html

限制文章源自略懂百科-http://wswcn.cn/80243.html

同时,这个数据集也有一些限制:扫描仪的捕捉区域不能容纳比面包箱 (约 50 厘米) 大的对象,因此该数据集不包括在其他数据集中较大的对象,如椅子、汽车或飞机。同样,扫描分辨率是有限的,所以非常小的对象不能以合理的保真度建模。此外,生成的纹理是漫反射的:高度镜面或透明的对象不能表征出来,生成结果也不够理想。文章源自略懂百科-http://wswcn.cn/80243.html

更多细节可参考原论文。文章源自略懂百科-http://wswcn.cn/80243.html

文章源自略懂百科-http://wswcn.cn/80243.html

懵懂先生
  • 本文由 发表于 2022年12月28日 18:01:38
  • 转载请注明:http://wswcn.cn/80243.html
投稿文章

武磊肩膀手术成功,武磊肩锁关节脱位手术

北京时间今晨,西班牙人俱乐部官方对外宣布,新援武磊在巴塞罗那的肩部手术成功,接下来需要6到8周恢复。 图说:西班牙人俱乐部官方微博 网络截图 俱乐部发布的官方公告如下:武磊今天下午在巴塞罗那格伦迪瑟斯...
投稿文章

仙剑奇侠传2电视剧 仙剑5电视剧没人看

不知道大家有没有发现,随着影视技术的不断发展,好剧却越来越少。 尤其在网剧盛行后,烂剧更是泛滥成灾。 狗血的剧情、辣人的演技、毁三观的人设——.总之,优秀的剧千篇一律地好看,烂剧却各有各的槽点。 于是...
投稿文章

欧洲人几点下班(欧洲人下班干什么)

***请点击上方红色的关注我们,您的关注,是我们努力的动力!谢谢!*** 日常中说到开发信、回盘就不得不说一下各国的时差,没有哪个外国客户愿意在美梦中收到一封漂洋过海的邮件。宁可自己起早贪黑,也要让客...
投稿文章

礼盒装的大闸蟹可以放几天(大闸蟹如何保存时间长)

导语:保存螃蟹时,直接放冰箱是大忌,教你1个妙招,存放7天都鲜活好吃 大家好,我是傻姐美食,生活中唯有美食和美景不可辜负。又到了吃螃蟹的季节,中秋前后的螃蟹最肥美了,不管是大闸蟹、青蟹还是梭子蟹,个个...