不管是否是大数据平台,只要使用容器化部署,一般在资源利用率、自动故障恢复、环境一致性、统一监控和日志管理、自动化部署、安全性等方面都显著优于传统的物理部署。但数据存储可能例外(其实只要能解决网络存储的带宽及网络延迟问题,我觉得也是比物理部署采用的本地存储要好的)。
另外,容器化部署能够通过动态资源管理、高可用性机制、持续集成和持续部署等手段,大幅提升系统的运行稳定性和效率,所以目前很多公司也都使用容器来实现大数据平台的部署。
关于大数据平台物理部署和容器化部署,在系统运行稳定性方面,很多人自然会理解物理部署系统稳定性肯定会好于容器化部署,其实只要容器化大数据作业管理组件设计好HA机制,在稳定性层面和传统部署并没有什么区别。只有容器化提供同样的稳定性,业务才愿意迁移作业到容器化集群里。这是最基本的要求。当然,混部场景下,为了确保在线服务不受影响,一些情况下会对离线大数据作业做一些资源方面的压制,让作业变慢,这是混合部署需要承担的代价。
收起在银行行业中,大数据平台的物理部署和容器化部署在系统运行稳定性方面存在一些区别。下面是对两种部署方式的解释和比较:
物理部署:
容器化部署:
在系统运行稳定性方面,物理部署和容器化部署有以下区别:
综上所述,物理部署和容器化部署在系统运行稳定性方面有一些区别。在选择部署方式时,需要综合考虑资源隔离、故障隔离、部署和更新的需求,以及组织的技术能力和资源情况。