莆田小鱼社区

搜索
查看: 3242|回复: 0

[硬件交流] 续断如何保证内网穿透隧道稳定——产品稳隧道才会稳

[复制链接]
发表于 2019-5-14 17:15:54 | 显示全部楼层 |阅读模式
  我有一个经验,流程中凡是有人类手工参与的环节是最容易出错的。因此,尽可能减少流程中人的参与是产品质量的有效保证。(手工劳斯莱斯除外). L0 V( e, W* Z5 f: _  y

, I  z  Z; I7 {  我又有一个经验,执行系统升级/回滚这样的关键操作时,要严禁手敲键盘一条条输入命令,而应该在pre-production环境下编写好命令手册,用复制粘贴的方式一步步来或者直接上脚本,原理见上一条经验。(Windows系统除外)
6 R1 {" q( n( F' k) Z4 x
  W9 ~4 G5 w3 O  我又又有一个经验,上面这两条你肯定知道,如果你还没这么做,肯定是客观环境不允许。(这条没例外)- G* b* B) m6 B! t

! D4 g  e. e+ L; b  续断研发团队一直在以最严格的流程迭代产品!然而,开始时并不是因为我们天生骄傲,而是老板不肯多招人……好吧,说正题,隧道稳不稳最重要还是产品稳不稳。续断研发团队做了这些工作,尽可能让产品“稳”如泰山。
2 H& i  `$ d1 Y7 z0 ~* K
2 }4 a+ k. @$ d* I0 o& ]  核心功能10倍测试代码
% r3 F* x8 d4 f5 g" M! V. M+ e- e9 v
  对C/S架构的产品来说,自动化测试实现起来要复杂一些。续断有213个测试用例涵盖隧道功能测试,隧道压力测试,客户端安装卸载,用户注册,充值,扣费等关键功能。按照代码行数粗略计算,每行核心代码有10行测试代码来保证质量一致。这213个测试用例哪里来的?坑踩的多了,攒的……
- n8 p+ P- u* p4 g  _4 j: p4 Q0 `# v( s; }- X
  
: G8 z' u5 s* V2 i& e! R& t" y* ]3 T# o/ ^* L
  40000次自动测试$ D$ H3 K+ Y3 k$ e( @
( {/ o' j4 H" x' x) r* Q
  200台测试设备╳每台设备213个测试用例≈40000次自动测试。
: g4 Z. {$ E3 n6 Q7 k+ w- |
2 s4 U( U* N0 ?' ]  190台OpenStack虚拟机,外加树莓派,香橙派,极路由,360路由,小米路由Pro,威联通,少量PC,笔记本电脑等。测试环境涵盖下表各类操作系统和版本,pipeline细致而繁杂,只有全部通过流程才会继续。
9 `9 t% i9 E- f7 v( m
# \# G1 V' X' x1 a# |3 ~' k  ' E6 p! L5 i9 T3 m; Z
2 @5 V! C: G" x5 w& L
  : ], m8 ?- f8 D* [0 i4 O4 ?
  C( s4 A  G& D
  升级/回滚3分钟,影响用户几秒钟% P& ?! n% ~) [- t# g7 v6 e

* `! R. ^6 Q0 G/ k& ]) s  深度应用CI/CDDevOps,Issue——Master——Pre-Production——Production,层次分明,验证充分。全容器化的服务端架构,让我们能在3分钟内完成对全球范围100多个续断服务器节点的升级/回滚,用户有感知的影响被控制在数秒钟以内。是的,”小个位数”秒以内,以至于让用户阅读升级公告都显得浪费时间,所以就不发公告了。1 \1 d( Q4 v# d8 }5 `
/ T# m- Z9 [' f4 O0 X8 m; P; G# H
  另外
: s& U/ K$ j4 z/ C. z( _" A2 u3 f8 U! C! D+ n% G- |$ m8 l# N! h8 a
  哲西信科官网www.zhexi.tech。我懂,这些都是常规操作,单讲数据的话被某某某一个朋友公司的产品碾压是分分钟的事。但摆数据不是为PK,而是要让我们续断的用户放宽心。续断是老司机开车,稳得狠!还没完,我们老板说了,“南来的北往的有疑问就请在评论区留下,都是程序员,我们踩过的坑不想看别人踩一遍,有必要可以给代码,帮到家”云云……不过我们老板有个特点是说话不算话,你老板不会恰巧也这样吧?$ ?# |  y& u7 R' H2 g

" A* t* i- i0 {0 H, Z7 q# o
. v. y# M0 U+ ?9 y' ^) X& O7 K' r
" M8 G7 U/ N( E8 i( I

本版积分规则

快速回复 返回顶部 返回列表