大会实录|清华徐葳:人工智能让数据中心更好运维

嘉宾介绍:徐葳,清华大学交叉信息研究院助理院长,青年千人学者,博士生导师,UC Berkeley 计算机系 PhD,曾供职于 Google。主要方向为基础架构的监控,日志等,目前以分布式系统以及人工智能等方向为主、包括人工智能、隐私保护、反欺诈等内容。 以下为徐葳在数人云PaaS Innovation 2017,构建灵动新IT大会上的演讲实录。 清华大学数据中心运维那点事儿 我(徐葳)显然是个科研人员,同时还管理很多行政事务等, »

演讲实录 | 招银云创:容器PaaS正在让开发人员再也看不到IaaS

嘉宾介绍:陈沙克,招银云创战略研究院总监,从2010年开始从事云计算相关工作,做OpenStack七年有余,目前在招银云创负责PaaS相关工作。此文为陈沙克在数人云PaaS Innovation 2017,构建灵动新IT大会上的演讲实录。 招银云创是招商银行的全资子公司,代表招商银行进行科技的输出,致力于将招行30年的经验和技术积累输出给广大金融企业,帮助同业同行快速的金融创新。 容器快速交付提高金融的互联网化 金融行业特性与其他行业在思维方式上有很大不同。 金融是强监管行业,尝试新技术面临监管的要求。那么,强监管下如何跟上变化的需要呢?这里面展开可以有很多故事。在Fintech互联网金融影响下,银行在监管上其实有所放松。其次,银行业有非常严格的安全性要求。由于历史原因, »

微服务架构企业级增强产品,数人云推出统一配置中心Hawk

11月16日,数人云在PaaS Innovation大会上,正式发布企业应用架构管理体系EAMS,这是数人云轻量化PaaS平台的重要产品体系,也是数人云向微服务方向延伸,践行微服务落地的战略调整。传统企业对微服务应用的管理需求日益强烈,微服务也成为云计算原生应用的标准开发框架,是落地敏捷开发和部署的关键。如今,EAMS产品家族又多了一位核心成员——数人云统一配置中心Hawk。 互联网企业和传统金融等行业具有业务配置复杂,配置数据量大,配置容易出错等特点,如何能将配置数据与程序包解耦,避免对环境的依赖成为一大难点。特别是引入微服务后,业务配置数量急剧增加,出错概率也同步增加,如果能统一管控,支持多环境管理成为运维的一大难点和痛点。 基于微服务理念打造的分布式统一配置中心Hawk支持多种类型配置如Spring Cloud、Dubbo、 »

《企业级容器云平台》联盟标准在数人云PaaS Innovation大会发布

11月16日,由中国开源云联盟WG6容器工作组和数人云联合主办的“PaaS Innovation2017,构建灵动新IT”大会在北京成功举办。会上,中国开源云联盟权威发布了企业级容器云平台标准。这是继去年由中国开源云联盟发布首个国内容器白皮书之后,容器技术发展的又一里程碑,标志着容器技术进入成熟稳定落地阶段。 近年来,容器技术逐渐成为继虚拟化技术之后对云计算领域影响深远的技术变革。容器技术从2013年传入国内,为各行业应用云计算提供了新思路,逐渐被研发人员和企业客户所接受。不断成熟的容器技术也对云计算的交付、效率和PaaS平台构建产生着深刻影响。容器已经成为企业落地微服务架构,实现DevOps理念的重要支撑技术。 企业级容器云平台标准权威发布 在发布环节,中国开源云联盟秘书长周平、常务副秘书长杨丽蕴、中国电子技术标准化研究院云计算标准资深专家陈志峰、央视网运维总监王雷、 »

数人云王璞:PaaS蝶变背后是三大技术趋势和三大落地方法

11月16日,由中国开源云联盟WG6容器工作组和数人云联合主办的“PaaS Innovation 2017,构建灵动新IT”大会在北京召开。本次大会由于汇聚了前瞻的PaaS洞察,着眼PaaS技术创新和演进趋势;梳理PaaS落地行业痛点,分享金融标杆客户最佳行业实践、重磅发布企业级容器云平台标准及推导PaaS落地方法,而广受业界瞩目。来自行业的专家、媒体朋友、生态伙伴,以及金融、能源、快消、制造等传统行业客户300余人参加了此次大会。 企业IT变革:轻量化、敏捷化、开源化 数人云CEO王璞博士做了以《云计算之PaaS进化: »

浅论Prometheus容器监控优缺点,2.0版本哪项改进受关注?

关于容器监控,数人云之前给大家分享了《解惑|你是否为容器监控操碎了心?》,就有有Prometheus的身影,那么它都有哪些优缺点?近日发布的2.0版本又有哪些改进?本文见分晓~ Prometheus解决了Devs如何监控高动态容器环境的问题,在本文中,Frederick Ryckbosch讲述了使用Prometheus的优点和缺点,以及它到底有多大的伸缩性。 Prometheus是一个基于时间序列的数值数据的监控解决方案,这是一个开源项目,由前Google员工在SoundCloud启动,他们希望监控一个高度动态的容器环境,因为对传统的监控工具不甚满意,所以开发出Prometheus,并在上面进行工作。 在本文中,我们将讨论Prometheus的重要设计决策及其影响,将重点讨论“ Digital Ocean” »

SRE|当Google的核心准则遇到Xero的最佳实践

关于SRE,数人云之前给大家分享很多相关的文章,想必大家已经有了一定的了解,今天给大家带来的这篇文章,分别从Xero和Google的角度讨论一些工具和框架,以及SRE的一些准则。 Xero的SRE之路 作为一个SRE,作者主要关心的是如何保持应用平台的稳定,减少崩溃,然而这也是不能避免的,本文会通过Xero的SRE经验去讨论一些工具和框架。 任何故障的开始都是至关重要的,因此需要在发现故障的第一时间就提醒能解决问题的人。 大多数的生产问题,都是通过监控基础设施进行检测的,用于告警的通道工具已经随着时间的推移而发生了变化,但是基本的流程仍然大同小异,如下图所示: 自动告警Pipeline 自动化Pipeline可以确保工程师快速、正确、一致和可靠的进行工作,理想的情况下, 所有的告警都应该是自动化的,但有时我们会接触到一些没有被发现的问题, »

Docker?Rkt?Lxd?细说K8S容器进行时的又一选项Containerd

器运行时是执行容器并在节点上管理容器镜像的软件,目前,最广为人知的容器运行时是Docker,但在生态系统中还有其他容器运行时软件,比如Rkt、Containerd和Lxd。Docker是现在于Kubernetes环境中使用的最常见的容器运行时,今天数人云给大家推荐一个Docker的组件——Containerd,它可能是更好的选择。 本文是由谷歌的软件工程师Lantao Liu和IBM的开源开发者Mike Brown基于自身相关实践,共同编写。 Kubernetes 1.5引入了一个名为容器运行时接口(CRI)的内部插件API,以方便地访问不同的容器运行时,CRI允许Kubernetes使用各种容器运行时,而不需要重新编译。从理论上说,Kubernetes可以使用任何实现CRI的容器运行时管理容器和容器镜像。 在过去的6个月中,来自Google、 »