本篇文章2538字,读完约6分钟

12月23日,在中国计算机顾客协会的指导下,由itechclub (网络技术精英俱乐部)教育委员会主办的国内网络技术行业最专业、最有影响力的大型教育科学技术领域盛会中国教育科学技术大会在北京召开

业务支持基础设施负责人董晓聪应邀参加这次大会,在运维安全后疫情时代的在线教育挑战分会场,业务支持如何通过基于云原生的多云建设,在业务快速发展过程中存在的稳定性、效率、价格、安全等问题 实现可持续的在线架构,阐明了技术改造带来的一系列好处,用实际例子深入阐述了技术变革继续教育的加速。

【科讯】作业帮受邀参加2020中国教育科技大会,基础架构负责人分享多云架构

以业务为导向,深入布局基于云原生的多云建设

这次大会以新业态新能源新教育为主题,网络教育科技行业许多专家、技术大咖啡在现场围绕中国教育科技现状、快速发展、创新、变革、机遇等多方面问题展开了深入的分析。 作业作为通过活用新技术来推进教育产业优化的领导者,云原生、模糊结构行业中的新思考、新布局在大会现场受到各界的关注。

【科讯】作业帮受邀参加2020中国教育科技大会,基础架构负责人分享多云架构

现在作业的中心业务包括帮助作业的app、帮助作业的直播课、帮助作业的口算、鸭子ai课、智能硬件猫咪机等多种教育产品。 其中,帮助k12学生做作业的app为k12学生提供了全学期的学习指导工具,现在月球上的客户超过亿,题库超过3亿,照片搜索问题的图像识别精度超过95%。 作业直播课作为为k12学生提供全时间段在线指导课程的产品,目前服务学生超过6500万人,直播课app在其学生方面,然后有巨大的教研、教育、指导工程体系的支持,作为商业化产品,

【科讯】作业帮受邀参加2020中国教育科技大会,基础架构负责人分享多云架构

董晓聪在演讲中说,作业以前传递过流量型网络产品,但也有教育全链的产业应用,根据公司业务的迅速发展现状,作业在稳定性、资源价格、人员效率、安全等方面面临着很多新的挑战

网上教育摆在我们面前的不是冰冷的uv、pv数字,而是求知的学生,我们的稳定性要更好,所以作业的帮助早就开始探索模糊的框架了。 董晓聪指出,业务支持作为面向业务的企业,通过云的原生结构,在基础设施上继承业务中的大量非功能逻辑,实现灵活性、韧性、观测性、自动化、可持续发展等特征。 基于云的本机体系结构,我们处理了部署问题,实现了可以在云之间自由移动的阴天体系结构。

【科讯】作业帮受邀参加2020中国教育科技大会,基础架构负责人分享多云架构

通过容器技术引进模式的升级,实现应用程序和资源的结合解除

现在,业务支持云的原生结构的整体情况从很大的层面来看,包括资源和应用两层。 在虚拟机架构中进行了应用和资源的双层结合,但集装箱技术的出现真的实现了两者的结合解除。 向下提供cri、cni、csi、device plugin等一系列资源抽象功能,而且实现执行环境的调度。 董晓聪说。 基于容器技术的部署模式升级从根本上处理了虚拟机模式下的混合部分、资源碎片化的许多问题。

【科讯】作业帮受邀参加2020中国教育科技大会,基础架构负责人分享多云架构

业务支援在运行环境中构筑遵从这一云原生的主线。 不仅实现了每个容器的一个应用程序,还实现了不采用特权容器、优化缓存构建等几乎稳定、安全、性能方面的要求。 我们的最佳做法对php pod来说,有几辆侧车通过插座与php主容器进行通信,通过configmap注入,数据库密码消息由secret加密存储。 golang pod也类似,但不需要日志等边缘程序。 有趣的是,作业支援也通过将前端模块容器化,可以一键提高前后端项目,可以大幅度提高开发效率。

【科讯】作业帮受邀参加2020中国教育科技大会,基础架构负责人分享多云架构

另外,从集群视图来看,在资源拓扑中,对于cpu和异种计算gpu来说,业务支持采用了通常的通信量+灵活部分的架构方式。 另外,作业辅助根据网络隔离域分割集群,根据业务行业分割namespace。

突破虚拟机体系结构的弊端,依靠云本机升级服务管理系统

在介绍了集装箱技术的引进、运用环境、集群等副本后,董晓聪分析了应用层的服务管理系统,业务支持进行了彻底的云原生改造后,其服务登记发现机制是coredns+service机制

如何实现新的老两种机制的转移呢? 通过使名称服务的消息与k8s集群同步,endpoint制作了指向虚拟机的service,实现了控制面的贯通。

从数据方面来看,虚拟机请求容器是通过使用service域名访问东西方的ingress集群来实现的。 因为容器群集贯穿数据,所以访问虚拟机,取得与容器相同的链接即可。

另外,在服务感知维度中,业务支援的整体调用链接从客户端的app、h5、小程序等到网关层、业务应用程序、最后到中间件。 我们把这些链接的日志汇总在kafka里。 现在kafka集群可以支持接近数千万的tps,峰值平均延迟在10s以内。 除了性能指标外,稳定性也是业务支持的重要评估因素,确保多级缓存不会丢失数据。 收集日志后,下游只需要订阅kafka,同时处理了大数据日志源的问题和logging、tracing、metrics的相关问题。 监视不需要在业务机器上执行,也不需要争夺资源,应用程序的入站日志和出站日志也可以绘制呼叫链接。

【科讯】作业帮受邀参加2020中国教育科技大会,基础架构负责人分享多云架构

多云的结构是网上教育的新业态,四个维度的利益是显而易见的

容器技术在处理了计算及其周边的存储、互联网的抽象化和高可用性保障后,新的挑战是如何连通阴天的? 以前只是传达互联网的应用时代,连接多个云制造商,但是在网上教育的新商业形态中,作业支援需要发表,指导老师的网络环境也需要纳入生产系统。

【科讯】作业帮受邀参加2020中国教育科技大会,基础架构负责人分享多云架构

因此,作业采用双供应商网络方式,使用bgp+ecmp实现线路负载均衡,自动切换故障秒级别,构建了真正高可用性的模糊互联网拓扑。

在调用拓扑级别,业务支持在不同的云上配置全量服务,只不过流量的比例不同,就实现了单云中的流量闭环。

值得注意的是,作业支援在今年完成云原生和阴天建设后,企业在四个维度的利益变得明显。 一是稳定性显着提高,应用程序之间的相互影响消失,单设备故障的影响时间也从分钟级缩短到秒级。 sla从99.95%上升到99.99%。 二是运维效率大幅度提高,实际运维规范落地运行环境,扩展效率从时间水平提高到分水平。 三是价格优化,通过升级生产环境提高性能,更全面地利用碎片,以及补充不同业务之间的资源。 四是阴天部署效率大幅提高,从以前的月水平缩短到现在的周水平,效率提高了80%以上。

【科讯】作业帮受邀参加2020中国教育科技大会,基础架构负责人分享多云架构

在演讲的最后,董晓聪对未来也提出了越来越多的展望,明年将与云供应商的容器、emr团队一起探索离线的更大规模的混合部署,基于operate实现中间件服务的云原生改造,

标题:【科讯】作业帮受邀参加2020中国教育科技大会,基础架构负责人分享多云架构

地址:http://www.miutrip.net.cn/news/419.html