Interrupção da CenturyLink levou a uma queda de 3,5% no tráfego global da web

Views: 468
0 0
Read Time:2 Minute, 54 Second

O provedor de serviços de Internet dos Estados Unidos, CenturyLink, sofreu uma grande interrupção técnica no domingo, depois que uma configuração incorreta em um de seus centros de dados causou estragos em toda a Internet. 

Devido à natureza técnica da interrupção – envolvendo firewall e roteamento BGP – o erro se espalhou para fora da rede da CenturyLink e também impactou outros provedores de serviço de Internet, acabando causando problemas de conectividade para muitas outras empresas. 

A lista de gigantes da tecnologia que tiveram serviços caiu devido à interrupção do CenturyLink inclui grandes nomes como Amazon, Twitter, Microsoft (Xbox Live), EA, Blizzard, Steam, Discord, Reddit, Hulu, Duo Security, Imperva, NameCheap, OpenDNS, e muitos mais. https://d2dbfd8d445b0df7cd09446e27c6c805.safeframe.googlesyndication.com/safeframe/1-0-37/html/container.html?n=0

A Cloudflare, que também foi gravemente afetada, disse que o problema de propagação externa da CenturyLink levou a  uma queda de 3,5% no tráfego global da Internet , o que tornaria esta uma das maiores interrupções de Internet já registradas.

Causa raiz: regra de Flowspec configurada incorretamente 

De acordo com uma  página de status da CenturyLink , o problema se originou no data center da CenturyLink em Mississauga, uma cidade perto de Toronto, Canadá.

A telco diz que a causa raiz do incidente foi um anúncio incorreto do Flowspec. de Anúncios

Flowspec é uma extensão do protocolo BGP que permite às empresas usar rotas BGP para distribuir regras de firewall em sua rede. Os anúncios do Flowspec geralmente são usados ​​ao lidar com incidentes de segurança, como sequestros de BGP ou ataques DDoS, pois permite que as empresas alterem toda a sua rede para reagir e mitigar ataques em segundos.

No entanto, a CenturyLink disse que seu data center em Mississauga enviou um anúncio incorreto do Flowspec que efetivamente impediu que as rotas BGP da empresa se enraizassem .

A Cloudflare, que observou o incidente de longe, acredita que a CenturyLink efetivamente colocou toda a sua rede em um loop, anunciando um novo conjunto de rotas BGP e, em seguida, descartando acidentalmente todas as rotas por meio da regra Flowspec configurada incorretamente.

As rotas BGP são a cola que mantém a internet funcionando. Eles são um tipo de mensagem que as empresas de Internet transmitem entre si. As rotas BGP informam a cada provedor de Internet qual bloco de endereços IP está disponível em sua rede.

No entanto, como o comando Flowspec incorreto do CenturyLink derrubou alguns dos roteadores dentro de sua rede, alguns desses roteadores também começaram a anunciar rotas BGP incorretas para outro serviço de Internet vizinho “Tier 1”.

Isso, por sua vez, derrubou outras redes em um efeito dominó. 

A interrupção levou sete horas para consertar 

CenturyLink corrigiu o problema dando a rara etapa de dizer a todos os outros provedores de Internet Tier 1 para desvincular e ignorar qualquer tráfego proveniente de sua rede. As empresas raramente tomam esse tipo de decisão, pois isso resulta em perda total de conectividade para todos os seus clientes.

Ao todo, a CenturyLink teve que reiniciar todos os equipamentos e começar com tabelas de roteamento BGP limpas, um processo que levou quase sete horas para ser concluído, de cerca de 12:13 UTC às 18:58 UTC, disse a empresa. 

“Esta foi uma interrupção global significativa da Internet”, disse Matthew Prince, cofundador e CEO da Cloudflare, em sua análise da interrupção.

FONTE: ZDNET

POSTS RELACIONADOS