ทำไมตึก กสท บางรัก ไฟดับแล้วทำให้ระบบเน็ตป่วนทั้งประเทศ
ทำไมตึก กสท บางรัก ไฟดับแล้วทำให้ระบบเน็ตป่วนทั้งประเทศ
อาคาร กสท บางรัก (อาคาร 30 ชั้นติดริมแม่น้ำเจ้าพระยา) เป็นอาคารโทรคมนาคม และเครือข่ายที่ใหญ่ที่สุดในประเทศไทย ภายในประกอบด้วย
- บริษัท Internet Data Center เปิดพื้นที่ให้บริการรับฝากวางเครื่องเซิร์ฟเวอร์ และให้บริการเชื่อมต่อโครงข่ายอินเทอร์เน็ตไปพร้อมๆ กัน
- ศูนย์แลกเปลี่ยนเส้นทางอินเทอร์เน็ตภายในประเทศไทยหลัก ของ กสท (CAT NIX)
- ศูนย์แลกเปลี่ยนเส้นทางอินเทอร์เน็ตต่างประเทศหลัก ของ กสท (CAT THIX หรือเรียกอีกชื่อว่า IIG)
- ระบบการเชื่อมต่อการสื่อสารผ่านสายใยแก้วนำแสง (fiber optic) ของบริษัทโทรคมนาคม (ทั้งอินเทอร์เน็ต โทรศัพท์ และโทรศัพท์มือถือ) เกือบทุกรายในประเทศ
- มหาวิทยาลัย ศูนย์การศึกษา สำนักงาน และส่วนพื้นที่ให้เช่าอื่นๆ (มีกระทั่งถ่ายทำละครในอาคารนี้ด้วยนะ!)
อาคารมีระบบสาธารณูปโภคพื้นฐานครบครันสำหรับการเปิดให้บริการศูนย์ข้อมูลระดับ 4 อยู่แล้ว ซึ่งมีข้อบังคับว่าจะต้องมี
- ระบบไฟฟ้าหลัก จากอย่างน้อย 2 โรงไฟฟ้า
- ระบบสำรองไฟฟ้า (UPS)
- เครื่องปั่นไฟฟ้า
- ระบบเชื่อมต่อเครือข่ายหลายเส้นทาง (Multiple uplinks) ผ่านสายเคเบิลใยแก้วนำแสง (Fiber optic cable) -- จากข้อมูลที่มี มีสายไฟเบอร์ลากมาที่ตึกนี้ไม่ต่ำกว่า 50 เส้น (ตัวเลขเป๊ะๆ ไม่เปิดเผย)
ในการนี้ก็มีผู้ให้บริการภายนอก ที่เชื่อมต่อผ่านมายัง CAT NIX/IIG ทั้งสองรายอยู่พอสมควร (ดูข้อมูลได้จาก แผนภาพอินเทอร์เน็ตประเทศไทย) โดยมีการเชื่อมต่อภายนอกที่สำคัญๆ ประมาณนี้ครับ (ข้อมูลเมื่อวันที่ 7 พฤศจิกายนที่ผ่านมาครับ)
- ทรูอินเทอร์เน็ต เชื่อมต่อหา IIG 58.5Gbps (50%) ใช้เป็นเส้นทางหลักสำหรับให้บริการลูกค้าตามบ้านทั่วไป
- Proen เชื่อมต่อไป TOT-NIX 10Gbps, TIG-DIX 5Gbps
- Otaro เชื่อมต่อไป ทรูอินเทอร์เน็ต 10Gbps, TOT-NIX 20Gbps
- ISSP เชื่อมต่อไป TIG-DIX 4Gbps
- ISPIO เชื่อมต่อไป TIG-DIX 10Gbps, TOT-NIX 40Gbps
ข้อสังเกตใหญ่มากคือ ISP หลายรายไม่มีการเชื่อมต่อหากันโดยตรง หรือผ่านบริการ NIX รายอื่นเลย หลายรายยังคงพึ่งพา CAT NIX อยู่เป็นหลัก โดยมีเส้นทางผ่าน NIX รายอื่นเป็นเส้นทางสำรองขนาดเล็กเท่านั้น ดังเช่นต่อไปนี้ (ในกรอบสีแดงเป็นส่วนข้อมูลที่แสดงว่ามีการใช้งานผ่าน CAT NIX ครับ)
ภาพตัวอย่างการส่งข้อมูลจากทรูอินเทอร์เน็ต ไปยังเครือข่ายของ TOT ในสภาวะปกติ
ภาพตัวอย่างการส่งข้อมูลจาก 3BB ไปยังเครือข่ายของ TOT ในสภาวะปกติ
ส่วนการเชื่อมต่อภายในตึก เนื่องจากมีผู้ให้บริการศูนย์ข้อมูลอยู่หลายราย ทำให้แต่ละรายก็มีวิธี รูปแบบ ความจุ และความสามารถในการให้บริการแตกต่างกันออกไปแล้วแต่ผู้ให้บริการครับ
เมื่ออาคารนี้เป็นศูนย์รวมการเชื่อมต่อทั้งภายในประเทศและต่างประเทศ ทำให้เว็บไซต์ชื่อดังเป็นจำนวนมากเลือกที่จะเช่าพื้นที่วางเครื่องเซิร์ฟเวอร์ เพื่อให้ผู้ใช้งานสามารถเข้าใช้งานได้เร็วที่สุด เช่น dek-d.com, manager.co.th, voicetv.co.th รวมถึงระบบโทรคมนาคมของเครือข่ายโทรศัพท์มือถือหลายๆ เจ้า และระบบเครือข่ายอินเทอร์เน็ตของ CAT เองด้วย
ในสภาวะปกติทางอาคารมีการเตรียมพร้อมรับมือภัยพิบัติต่างๆ เช่น น้ำท่วม ไฟไหม้ หรือแม้กระทั่งเหตุการณ์อย่างสายไฟเบอร์ถูกตัด ตามมาตรฐานของศูนย์ข้อมูลชั้นนำทั่วไปอยู่แล้วครับ ซึ่งที่ผ่านมา (ไม่นับเหตุการณ์ที่บาง ISP ล่มเอง) ตัวอาคารเองก็ถือว่าสามารถให้บริการได้ตามมาตรฐานที่ควรจะเป็น แต่คงไม่ใช่เหตุการณ์ที่ "เครื่องปั่นไฟฟ้าถูกถอดวงจรแผงควบคุม" แน่นอน เมื่อกระแสไฟฟ้าถูกตัด ไฟฟ้าสำรองก็อยู่ได้ไม่นาน เครื่องปั่นไฟทำงานไม่ได้ ก็ทำให้อุปกรณ์ทั้งหมดดับลงไปครับ ส่วนผลกระทบที่เกิดขึ้นก็ประมาณนี้ครับ
- ระบบอินเทอร์เน็ตภายในประเทศผ่าน CAT NIX ใช้การไม่ได้ทั้งหมด (ข้อมูลจาก ISP อื่น เส้นทางที่วิ่งไปหา NIX หายจากอินเทอร์เน็ตไปเลย 100%)
- ระบบอินเทอร์เน็ตออกต่างประเทศผ่าน CAT IIG ใช้การไม่ได้เกือบทั้งหมด (ตรวจสอบจาก ISP ต่างประเทศยังเหลือเส้นทางอยู่พอสมควร)
- ช่องทางออกต่างประเทศของทรูอินเทอร์เน็ตตามบ้านก็ใช้การไม่ได้ไปด้วยบางส่วน ทำให้หลายๆ คนเข้าใช้งานเว็บไซต์ต่างประเทศไม่ได้ไปพักใหญ่ๆ
- อินเทอร์เน็ตของ CAT ล่มทั้งประเทศ (ระบบหลักอยู่ที่นี่)
- บริการโทรศัพท์มือถือ my by cat ล่มเป็นวงกว้าง (น่าจะทั้งประเทศ), Truemove-H ล่มหลายพื้นที่ (เข้าใจว่ามีระบบสำคัญๆ บางอย่างที่เชื่อมต่อมาจาก CAT)
- ศูนย์ข้อมูลที่อยู่ภายในอาคารทั้งหมดไม่สามารถให้บริการได้
- เว็บไซต์จำนวนมาก (ตัวเลขประมาณการโดยผู้เขียนคือระดับหลักหมื่น) รวมถึงบริการบนอินเทอร์เน็ตอื่นๆ ที่อยู่ภายในอาคารไม่สามารถใช้งานได้โดยสิ้นเชิง
- บริการ CDN ของเว็บไซต์ต่างประเทศหลายตัวไม่สามารถเข้าใช้งานได้ เนื่องจากพึ่งการส่งเส้นทางรับส่งข้อมูลบนอินเทอร์เน็ต และมีการจำกัดเครือข่ายที่เข้าใช้งานไว้ แต่เส้นทางเปลี่ยนจนเกิดการส่งไปยังเครื่องเซิร์ฟเวอร์ที่อยู่เครือข่ายอื่นที่ไม่ได้ตั้งค่ารับการเชื่อมต่อไว้
- การสื่อสารข้ามเครือข่ายบางส่วน (เช่น TOT กับ 3BB , TOT กับ True) ต้องวิ่งผ่านเส้นทางต่างประเทศทำให้ใช้งานได้ช้าลง หรือไม่สามารถเชื่อมต่อกันได้เลย
- หลังจากไฟฟ้ากลับมาปกติ พบว่ามีอุปกรณ์บางส่วนชำรุดเสียหาย ทำให้เสียเวลาซ่อมแซมและเปลี่ยนอุปกรณ์นานขึ้นไปอีก
ส่วนที่ไม่ได้รับผลกระทบ หรือได้รับผลกระทบน้อยมากมีประมาณนี้ครับ
- การใช้งานเว็บไซต์ต่างประเทศจากอินเทอร์เน็ตอื่นที่ไม่ใช่ทรู
- สำหรับผู้ให้บริการโทรศัพท์มือถือค่ายอื่นๆ
- AIS ใช้โครงข่ายหลักของ SBN ที่เชื่อมต่อหาทุก IX อยู่แล้ว
- Dtac มีการเชื่อมต่อสำรองผ่าน CSLoxinfo IX ที่ก็เชื่อมต่อครบทุก IX เช่นกัน
- การใช้งานเว็บไซต์ที่มีโครงข่ายเป็นของตัวเอง หรืออยู่กับผู้ให้บริการรายอื่นที่มีการเชื่อมต่อหลายเส้นทาง ไม่ได้อยู่ในอาคารนี้ และไม่ได้ต้องเรียกใช้ข้อมูลจากเครื่องที่อยู่ภายในอาคาร
ทิ้งท้ายกันด้วยสิ่งที่ควรปรับปรุงหลังจากนี้ คือมาตรการรักษาความปลอดภัยเชิงกายภาพของระบบสาธารณูปโภคสำคัญสำหรับการให้บริการศูนย์ข้อมูล ไม่ควรให้ใครเข้ามาตัดระบบได้ง่ายๆ แบบครั้งนี้ครับ
ขอบคุณเนื้อหา และภาพประกอบ
บทความโดย: icez