日本人又鞠躬了:通信故障大不大?

      最后更新:2022-07-06 01:24:47 手机定位技术交流文章

      日本第二大移动运营商KDDI因设备故障突然停电,影响了近391.5百万用户,占日本人口的三分之一。

      |全球通讯 |良好的5G |

      通信行业最具影响力的媒体

      KDDI在日本遭受历史上最严重的网络中断4百万用户受影响

      7月2日早上1:35,日本移动通信运营商KDDI发生大规模通信故障,导致全日本没有通话、没有短信和数据通信延迟。

      这场灾难是广泛的,持久的,影响了391.5百万用户,持续到7月4日下午,基本上完全恢复,给整个日本社会造成了巨大的不便和损失。

      事故发生后,KDDI高级官员及时召开记者会,向大量受影响人士及企业用户道歉,并表示考虑赔偿损失。

      是什么导致了大规模的通信失败?

      核心阅读点:在日常维护中更换核心路由器的升级会导致VoLTE交换机报告错误,大量VoLTE连接已经被切断。他们重新启动了VoLTE开关,这导致大量客户要求重新连接,把交换机挤爆了。该交换机不正常工作,导致用户数据库数据不一致,故障的规模进一步扩大.最后,您只能在限制流时恢复数据库,拖到了现在。

      1,KDDI事故声明:
      事件概况(事实证明)
      ・事件影响的说明
      ・事件原因的说明
      主要治疗的反应状态按时间顺序显示
      目前正在考虑预防复发措施(持续治疗)
      总统简要地解释了这一点。





      KDDI 的 报告 的 理由 如下 :

      故障原因一:

      核心路由器割接失败

      7月2日早上,KDDI组织工程师连接一个连接全国移动核心网络和继电器网络的核心路由器,以新产品取代旧的核心路由器。

      不幸的是,通信器最糟糕的噩梦发生了——序列失败。 在更换核心路由器的过程中,新的核心路由器遇到了一个未知的故障。


      正如通信伙伴所知道,核心路由器位于整个网络的核心,是整个网络的“交通枢纽”,不仅性能强,成本高,而且需要保持稳定运行,否则,一旦问题发生,它会影响整个网络的数百万甚至数千万用户。

      因此,将核心路由器的“心脏”换成活人的“心脏”是一个非常艰巨的任务,需要新的产品具有很高的成熟度、稳定性和互操作性。

      然而,KDDI lost the link to this extremely cautious work, and the consequences of that were, of course, quite serious – because the new core router could not properly route voice traffic to the VoLTE exchange node, leading directly to a 15-minute interruption in some VoLTE voice operations.

      故障原因二:

      VoLTE网络受信号暴风雨摧毁

      内核路由器序列失败, 这个场景难以想象, 会吓坏屏幕的冷汗!

      7月2日早上1:50,KDDI的工程师迅速启动返回操作,将重新连接和更换老核心路由器。

      但还有更大的问题。


      回退后,“因为VoLTE终端每50分钟一次登记位置,”许多终端开始向VoLTE交换节点发送位置登记信息,以重新连接至网络。海量信令集中突发,快速触发VoLTE交换节点拥堵,大量用户无法通过VoLTE进行通信。

      同时,在移动网络中有一个“用户数据库”。负责存储用户签名数据和位置信息,由于 VoLTE交换节点拥挤,“用户数据库中的登记位置信息不能反映在VoLTE开关上”,数据匹配有问题,它也阻止许多用户进行通信和电话。

      针对此情况,KDDI于7月2日上午3时开始从无线网络和VoLTE核心网络两侧同时实施交通控制策略,并通过解开PGW来减轻用户数据库负载,以缓解网络拥塞,而PGW使用“消息移位”措施来解决用户数据库中的数据不一致性。

      注:40万伏特的用户共享一个核心网络,但不能适应第二架飞机? 这感觉好像小日子没好转。 这种中断累积的障碍时间,只是害怕超过中国运营商故障时间的寿命周期!


      由于实现流量控制,导致的全国数据通信和语音通话难以连接。

      随后,KDDI开始恢复紧张的网络,7月3日上午11时,KDDI宣布在西日本完成网络恢复工作,下午5时30分在东日本完成,但仍有一些用户难以与数据沟通和进行语音电话。


      至7月4日下午4点,故障发生62小时后,KDDI表示,该系统在全国各地已基本恢复。

      根据《日本电讯法》的规定,如超过30万人在一小时内无法致电消防署或警察,这将被认为是“重大事故”。显然,这是一起重大事故,最近在许多国家发生了类似重大的通讯事故,在中国,由于网络升级测试,一些运营商也影响了某些用户的使用。

      三、有何借鉴意义?

      业界指出:在5G时代,通讯网络发生了根本的变化,这种变化有多种方面。在网络层面,上网需求激增,短信和语音业务正在转向新的模式,企业本身和网络提出了一个新的挑战,在用户层面,多因素混合影响,局部流可以随时造成全负荷或过负荷(类似的例子,即使有云服务的快速调整支持,由于交通拥挤,也出现了重复的缓慢连接事件。

      开放RAN,由诸如美国等国家积极推动,这将削弱网络运营商对几个主要电信设备供应商的依赖,但它也给网络运营商提出了更高的要求,这给网络带来了不确定性,它也增加了网络故障的概率(在一定程度上,设备故障对整个网络的影响也降低了.

      从电信网络运营商,一方面,我们应该接受开放的RAN、云、大数据、计算、工业应用以及其他新技术和应用。积极把握新技术带来的新商业机会,另一方面, 必须 保持 对 用户 的 尊重 、 技术 稳定 和 不断 加强 紧急 反应 准备 和 训练 的 高度 要求 。为了尽量减少网络故障的发生,并通过快速紧急方案,减少失败的影响。

      从普通用户角度,它不仅仅是被动地接受网络故障,它也可以采取积极的反应,以避免因网络故障而造成的损失。包括网络故障、网络盲点和用户自己的原因(例如丢失费用、不需要的实名认证)。具体做法是,不要把所有联络号码放在一个操作员身上.最好的方法是同时有两个数字。根据目前的电信运营商的合作,你可以选择“中国在线”的电话号码(在互联网上可用),中国移动或中国电信有数码(低流量、低声),其中一个选择一个大容量的包作为共同数目,另一个可选的日租卡或其它低价和重叠低流量的包作为备份。这种选择可以按需要在南部和北部进行。

      这一点其实很重要,有的人有双卡双待,或者两个以上手机,不处理两个相同的操作员号码,此外,如果使用移动网络传输政策成为承运商,这是最大的败笔。其实,如果你喜欢另一家航空公司,你就新办一个,老的别携号转网,记住,有经营者会给你折扣,当然,它成为一个低包装的高流,你可以享受两家航空公司的服务,关键是:网络故障或无信号紧急情况,另一个牌子会奏效的!

      - END -

      基层交流


      作者@好5G:高级分析家|专栏作家|新媒体专栏作家|手机评估专家

      环球通信

      通信行业最具影响力的媒体

      Official WeChat: China_3g (Private WeChat: zghao4g)

      答复"目录"搜索号码,答复号码阅读条目

      Sina Millionaire @ Good 5G,坚持做一个态度的原始数字

      本文由 在线网速测试 整理编辑,转载请注明出处,原文链接:https://www.wangsu123.cn/news/29395.html

          热门文章

          文章分类