“你知道什么了?”
“规律,我们的重启有很明显的规律,它是个轮回。”
路文涛摘下耳机,瞪着杰瑞:“轮回?你还四象生八卦,八卦化重启?靠!问题搞不掂,玄学出来了?”
杰瑞指着挂历:“我们总想着17日、21日、24日的日期,实际上是每个星期五凌晨两点市区的基站重启,每个星期二凌晨两点郊区的基站重启,换成星期几来看,规律就看得明显了!接下来应该是28日星期二凌晨郊区的基站重启了。”
路文涛朝着墙上挂历:“你这有点牵强附会吧?那为什么会这样?我们的新版本会来大姨妈?一个星期来一次?”
“为什么会这样?这要产品研发来回答,我又看不到代码。不过,你看!”
杰瑞说着站起来,拿一支白板笔,走到挂历前,在10日上画了两个星星,在14日上画了两个圈圈:“我们10日把城里的更新了版本,因为那天客户老大发飙,所以客户要求我们多观察两天,确认新版本不会比原来的更烂以后再动郊区的,我们是在14日凌晨更新了郊区的版本。我们更新版本时正好是在凌晨两点多做了一次重启,现在应该是从第一次重启的时间开始,每运行七天就会重启一次,城里是10日、17日、24日,郊外是14日、21日。”
路文涛觉着他讲的有逻辑了,问:“10日和14日更新版本的时候,几十个基站都是在两点多同时重启?”
杰瑞说:“老大,我们升级是把新软件通过网管成批地发到基站上去的,我记得差不多都是在这个时间点,这个可以查得到。”
一旦发现了问题规律和线索,定位原因就快了。
产品研发团队找到了故障原因,新版本软件质量存在问题:
软件设计中在某处XXX 字节内存,每次应该占用一部分然后释放,结果它不释放,七天之后内存溢出,程序运行要用到的内存大于系统能提供的最大内存,此时程序就运行不了,导致自行重启。并且周而复始,每七天溢出、重启一次。
一旦定位了问题原因,解决问题就快了。
他们再次更新了软件,这次产品研发提供的是热补丁,也就是说不需要中断业务,不需要重启设备就可以修复当前版本的缺陷。
终于,“伟中”跌跌撞撞通过了小规模验证的验收,项目进入到大规模部署基站的阶段。下一阶段,他们要用七个月时间在德国全境部署几千个无线基站。
产品研发主管给路文涛打了一个电话,他不好意思地说:“路总,这次版本问题多了点,一线的兄弟们辛苦了!你老大多担待!”
“确实太烂了!内存溢出没告警、没日志的?不过,我聚焦解决问题,不发泄情绪,现在问题解决了,公司该怎么回溯、问责版本质量不关我的事!”
路文涛记起了什么,立即接着说:“不行,我要给你发个感谢信,感谢你及时提供版本、及时排除故障!上次大佬们威胁要把我俩对调个位置,让我俩对换脑袋思考,对换屁股继续撕,我在海外还没呆够了,而且能力有限,干不了你这个活儿!万一大佬们还没忘记这事,决定现在把你踢到德国来,让我回去填你的坑,那我可会死得很快!”
长江上游滩多流急,中游水道复杂,下游静水潜流,在这个世纪的第二个十年,“伟中”的全球化之路就仿佛是长江行船到了中流,公司在海外各国的一线团队常常会撞上过去不曾遇见过的挑战。
这种挑战区别于初登上全球化大舞台之际因为陌生而来的新鲜挑战,而是当你站在舞台中央之后,因为聚光灯把你从头到屁股照得纤毫毕现而来的复杂挑战。
一波即平,一波即起,眨眼到了9月下旬,“莱茵电信客户部”风波又起。
这一次惹来麻烦的是伟中公司“莱茵电信”无线替换项目组的技术总负责杰瑞,但他惹来的麻烦却不是一个技术问题。
本章已完 m.3qdu.com