Untitled Document

Untitled Document


HomeHome


ปัจจุบันแผนการกู้คืนระบบจากความเสียหาย (Disaster Recovery) กลายเป็นสิ่งสำคัญและจำเป็นสำหรับองค์กรที่ขับเคลื่อนธุรกิจด้วยระบบไอที เพราะเป็นที่ยอมรับกันว่าถ้าหากระบบไอทีเกิดขัดข้อง หยุดชะงัก หรือถึงขั้นล่มสลายอันเกิดจากเหตุการณ์ใด ๆ ก็ตาม เช่น ไฟไหม้, แผ่นดินไหว, น้ำท่วม, ตึกถล่ม, ภัยก่อการร้าย เป็นต้น อาจจะส่งผลเสียหายกับองค์กรอย่างมหาศาล ดังนั้นองค์กรที่ต้องพึ่งระบบไอทีจึงต้องให้ความสำคัญอย่างหลีกเลี่ยงไม่ได้กับการกู้คืนระบบ ซึ่งแผนงานดังกล่าวเป็นอีกหนึ่งงานที่สำคัญและท้าทายสำหรับผู้บริหารระบบไอทีที่จะต้องพิจารณาและบรรจุไว้ในแผนแม่บทในการบริหารระบบไอที

ในบทความนี้จะขอพูดถึงองค์ประกอบที่มีความสำคัญกับการวางแผนการกู้คืนระบบ นั่นคือการทำสำเนาข้อมูลจากศูนย์ข้อมูลหลัก (Primary Site) ไปยังศูนย์ข้อมูลสำรอง (Disaster Recovery Site) และเพื่อให้สอดคล้องกับชื่อบทความ “Disaster Recovery ไร้พรมแดน” ในบทความนี้จึงขอพูดถึงโซลูชั่นที่จะทำให้เราสามารถทำสำเนาข้อมูลจากศูนย์ข้อมูลหนึ่ง ไปยังอีกศูนย์ข้อมูลหนึ่งได้โดยไม่ต้องผูกติดกับเทคโนโลยีของ Server และ Storage ของค่ายใด ๆ


 
ก่อนจะกล่าวถึง Solution สำหรับรองรับกระบวนการในการกู้คืนระบบ ผมขอกล่าวถึงคำ 2 คำที่เกี่ยวข้องกับโซลูชั่นที่จะใช้ในการกู้คืนระบบ คือ

RPO ถ้ากล่าวโดยสรุปก็คือหลังจากที่ระบบเกิดความเสียหายแล้ว เรายอมรับการสูญหายของข้อมูลได้มากน้อยแค่ไหน เช่น ถ้าหากระบบเกิดความเสียหายตอน 11:00 นาฬิกา เราต้องการกู้คืนข้อมูลที่ ณ เวลา 10:30 นั่นหมายความว่า เรายอมรับการสูญหายของข้อมูลที่ 30 นาที เป็นต้น 

RTO หมายถึงหลังจากที่ระบบเกิดความเสียหาย เราต้องการให้ระบบกลับมาใช้งานได้ภายในเวลาเท่าไร เช่น เรามี RTO 2 ชั่วโมง นั่นหมายความว่าหลังจากระบบเกิดความเสียหาย เราจะต้องสามารถทำให้ระบบกลับมาให้บริการได้ภายใน 2 ชั่วโมง เป็นต้น

 
ทุกครั้งที่เราวางแผนเพื่อรองรับความเสียหายที่อาจจะเกิดขึ้นกับระบบไอที เราต้องพูดถึง RPO และ RTO เนื่องจากปัจจัยทั้ง 2 สิ่งนี้เป็นนโยบายของแต่ละองค์กร ซึ่งจะเป็นตัวกำหนดโซลูชั่นหรือแนวทางในการกู้คืนระบบ และแน่นอนว่าถ้าหากองค์กรใด ๆ ต้องการ RPO และ RTO ต่ำ ๆ ก็ย่อมต้องการโซลูชั่นและเทคโนโลยีที่ทันสมัยซึ่งหมายถึงค่าใช้จ่ายก้อนโตที่องค์กรจะต้องจ่ายในการทำระบบเพื่อรองรับความเสียหายที่อาจจะเกิดขึ้นในอนาคต
 
 

 

กราฟข้างบน แสดงความสัมพันธ์ระหว่าง RPO และ RTO ที่มีต่อโซลูชั่นและค่าใช้จ่ายของการเลือกเทคโนโลยีสำหรับรองรับการกู้คืนระบบจากความเสียหาย
 
ถ้าหากองค์กรที่ต้องการ RTO ที่ต่ำในระดับเป็นวินาทีหรือนาที เราจำเป็นต้องใช้เทคโนโลยีขั้นสูงเพื่อช่วยให้ระบบสามารถกลับมาทำงานได้อย่างรวดเร็วหลังจากความเสียหาย เช่น Global Cluster เทคโนโลยี เป็นต้น แต่ถ้าหาก RTO มากกว่านั้นเราอาจจะเลือกใช้วิธีการ Replicate ข้อมูลไปเก็บไว้ที่ปลายทางแล้วใช้วิธีการ Manual ในการทำให้ระบบกลับมาใช้งานได้อีกครั้ง หรือถ้าหาก RTO มีเวลาเป็นวันหรือสัปดาห์ เราอาจจะเลือกใช้การ Restore ข้อมูลจาก Tape Backup ก็ได้ ทั้งนี้ผู้บริหารระบบไอทีจำเป็นจะต้องเลือกใช้เทคโนโลยีเพื่อให้สอดคล้องกับเป้าหมายและค่าใช้จ่ายขององค์กร

RPO ที่ระดับต่ำ เช่น เป็นระดับวินาที, นาที หรือชั่วโมง ต้องการเทคโนโลยีในการสำเนาข้อมูลจาก Primary Site ไปที่ Disaster Recovery Site ที่รวดเร็วและแม่นยำ ซึ่งปัจจุบันเป็นที่ยอมรับกันว่าการ Replicate ข้อมูลเป็นเทคโนโลยีที่สามารถตอบสนองความต้องการขององค์กรที่ต้องการ RPO ในระดับต่ำ ๆ ได้ ซึ่งในเทคโนโลยีในการ Replicate ข้อมูลสามารถแบ่งออกได้เป็น 3 ประเภทหลัก ๆ คือ

เป็นวิธีการ  Replicate ข้อมูลโดยใช้ 3rd Party Software ไปติดตั้งลงบน Server ที่ต้องการ Replicate ข้อมูล ซึ่ง Replication Software จะทำหน้าที่ส่งข้อมูลจากต้นทาง ไปยัง Server ปลายทางผ่านระบบเครือข่าย TCP/IP ซึ่ง Software ประเภทนี้ได้แก่ Symantec Volume Replicator, Symantec Replicate Exec, EMC RepliStor เป็นต้น หรือในบางกรณีเราสามารถใช้ความสามารถของ Application ในการ Replication ข้อมูลของตนเองจากต้นทางไปยังปลายทางได้ เช่น Microsoft Exchange 2007, Microsoft SQL 2005 หรือ Oracle เป็นต้น ข้อจำกัดหรือข้อที่ต้องพิจารณาเป็นพิเศษในการ Replicate ข้อมูลแบบนี้คือเราต้องเสีย Resource ส่วนหนึ่งของ Server เช่น CPU, Memory, Network, Disk เป็นต้น ในการทำ Replication ซึ่งอาจจะส่งผลต่อ Performance ของระบบในระหว่างการทำงานได้

เป็นวิธีการ Replicate ข้อมูลโดยใช้ความสามารถของ Storage System ในการส่งข้อมูลจาก Storage ต้นทาง ไปยัง Storage ปลายทางโดยอาจจะผ่านระบบเครือข่าย TCP/IP หรือ Dark Fibre ซึ่งทั้งนี้ทั้งนั้นก็ขึ้นอยู่กับ RPO ของแต่ละองค์กร การ Replicate ข้อมูลด้วยวิธีการแบบนี้ไม่ต้องใช้ Resource ของ Server เพราะ Storage System จะเป็นตัวจัดการทั้งหมด แต่ข้อจำกัดของการ Replicate ข้อมูลด้วยวิธีการแบบนี้คือ Storage System ทั้ง 2 ฝั่งต้องเป็นยี่ห้อและประเภทเดียวกัน ซึ่งปัจจุบัน Storage System ส่วนใหญ่ในท้องตลาดจะมีความสามารถในการทำ Replicate ข้อมูลบนตู้ Storage ของตนเอง เช่น EMC CLARiiON, EMC Symmetrix, HP StorageWorks EVA, HP StorageWorks XP เป็นต้น 

เป็นวิธีการ Replicate ข้อมูลอีกประเภทหนึ่ง ที่สามารถ Replicate ข้อมูลจาก SAN Storage ฝั่งต้นทางไปยังฝั่งปลายทางผ่านเครือข่าย TCP/IP โดย Storage ทั้ง 2 ฝั่งไม่จำเป็นจะต้องเป็นยี่ห้อและตระกูลเดียวกัน และในการทำงานก็ไม่ต้องใช้ Resource ของ Server ในการประมวลผล ซึ่งเทคโนโลยีประเภทนี้เปรียบเสมือนการรวมข้อดีของ Software Replication เข้ากับ Hardware Replication ซึ่งปัจจุบันโซลูชั่นที่เป็นประเภท Appliance Replication ในท้องตลาดได้แก่ EMC RecoverPoint 
ในบทความนี้จะกล่าวถึง EMC RecoverPoint เพื่อเป็นทางเลือกให้กับผู้บริหารไอทีในการวางแผนการกู้คืนระบบจากความเสียหาย ซึ่ง EMC RecoverPoint สามารถทำงานได้โดยไม่ยึดติดกับ Operating System และ Storage Platform (ต้องอยู่ภายใต้ Certified Compatibility List ของ EMC) และนอกจากนี้ EMC RecoverPoint ยังสามารถทำงานได้โดยไม่ต้องใช้อุปกรณ์ประเภท Multi-Protocol Router เพื่อเปลี่ยน FC Protocol ให้เป็น IP Protocol ทำให้เราสามารถวางแผนและออกแบบระบบ Disaster Recovery แบบไร้พรมแดนได้อย่างแท้จริง


EMC RecoverPoint ซึ่งต่อไปนี้จะขอเรียกสั้น ๆ ว่า “RP” เป็นโซลูชั่นสำหรับทำสำเนาข้อมูลอีกตระกูลของ EMC ที่สามารถทำสำเนาข้อมูลจากต้นทางไปยังปลายทางได้โดยไม่จำเป็นต้องมี Storage ยี่ห้อเดียวกัน โดย RP จะเป็นโซลูชั่นประเภท Appliance ที่เชื่อมระหว่างโลกของ Fibre Channel กับโลกของ IP ให้เป็นเสมือนโลกเดียวกันเพื่อให้ข้อมูลจากฝั่งต้นทางสามารถส่งข้ามไปฝั่งปลายทางได้โดยไม่จำเป็นต้องใช้อุปกรณ์เสริมประเภท Multi-Protocol Router

หลักการทำงานของ RP คือ RP จะทำหน้าที่ตรวจจับ I/O ที่ส่งมาจาก Server แล้วทำการแยกออกเป็น 2 ชุด ซึ่งชุดแรกจะส่งไปยัง Original Storage ส่วนอีกชุดจะถูกส่งไปยัง Journal ของ RP ต้นทางเพื่อทำการส่งต่อไปยัง Journal ของ RP ที่ปลายทางและ RP ที่ปลายทางก็จะทำการเขียน I/O ดังกล่าวลง Storage เพื่อใช้สำหรับการกู้คืนระบบต่อไป
 

รูปแสดงการทำงานของ EMC RecoverPoint


  • ทำหน้าที่แยก I/O ออกเป็น 2 ชุดเพื่อส่งต่อไปให้ RecoverPoint
  • ปัจจุบันตัว Splitter Driver มีให้เลือก 3 ประเภท คือ
    • RecoverPoint Host Splitter Driver (KDriver) ซึ่งเป็น Driver ที่ไปติดตั้งบน Host เช่น Windows, Solaris เป็นต้น
    • CLARiiON CX3, CX4 ซึ่งเป็น SAN Storage ของ EMC ที่มีความสามารถในการแยก I/O ที่ส่งมาจาก Server ออกเป็นหลาย ๆ ชุด
    • Intelligent Fabric Switch ซึ่งเป็น SAN Switch ที่มี Function ในการ Split I/O ได้ เช่น Brocade SAS API บน AP-7600B หรือ Cisco SANTap API บน MDS-9000 Series เป็นต้น

  • ติดตั้ง RecoverPoint Software
  • ทำหน้าที่ส่งข้อมูลจาก RP ต้นทางไปยัง RP ฝั่งปลายทาง

  • เป็นพื้นที่ Disk ของ RecoverPoint ซึ่งใช้ในการเก็บข้อมูลของ Production LUNs ที่มีการเปลี่ยนแปลง
  • รองรับการ Restore ข้อมูลย้อนหลังณ จุดใด ๆ ได้ เช่น ต้องการ Restore ข้อมูลเมื่อ 10 นาทีก่อนเกิดความเสียหาย เป็นต้น

ซึ่งเป็นเครือข่าย TCP/IP สำหรับ RP ในการส่งข้อมูลจากต้นทางไปยังปลายทาง โดย RP สามารถทำการบีดอัดข้อมูลได้ถึง 3-15 เท่าก่อนการส่งไปยังปลายทางทำให้ประหยัด Bandwidth และเพิ่มความเร็วในการส่งข้อมูล และนอกจากนี้ RP เป็น Appliance ที่สามารถทำงานโดยไม่ต้องใช้ FC/IP Converter (Multi-Protocol Router) ที่ราคาค่อนข้างสูงอีกด้วย

หลากหลายยี่ห้อ ไม่ว่าจะเป็นของ EMC เอง หรือเป็น 3rd Party Storage ยี่ห้ออื่น เช่น HP, IBM, SUN, NetApp เป็นต้น (ต้องอยู่ภายใต้ Certified Compatibility List ของ EMC)

EMC RecoverPoint สามารถนำมาใช้ได้หลากหลายวิธีขึ้นอยู่กับความต้องการเรื่อง RPO ของแต่ละองค์กร ซึ่งการปกป้องข้อมูลของ RecoverPoint สามารถทำได้ 3 วิธีดังนี้
 
  • การปกป้องข้อมูลฝั่งต้นทางเพียงอย่างเดียว ซึ่ง RP จะมี Feature ที่เรียกว่า “Continuous Data Protection (CDP)” ซึ่งทำหน้าที่ในการทำสำเนาข้อมูลต้นฉบับแบบ Real Time สำหรับการกู้คืนข้อมูลจากความเสียหาย ณ จุดใด ๆ ของข้อมูล (Point-in-time Recovery) รูปด้านล่างแสดงหลักการทำงานของ CDP กล่าวคือ ข้อมูลจาก Application ฝั่ง Server ที่ถูกเขียนลงมาที่ Original Storage จะถูก RecoverPoint จับแยกและเขียน I/O อีกชุดไปเก็บไว้ที่ Local CDP Journal ซึ่งในกรณีที่ต้องการเรียกคืนข้อมูล เราสามารถเรียกคืนข้อมูล ณ จุดใด ๆ ที่เก็บอยู่ใน Local CDP Journal ได้

  • การ Replicate ข้อมูลจากฝั่งต้นทางไปยังฝั่งปลายทาง ซึ่ง RP จะมี Feature ที่เรียกว่า “Continuous Remote Replication (CRR)” ในการส่งข้อมูลจาก Storage ต้นทางไปยัง Storage ฝั่งปลายทางโดยไม่อิงกับยี่ห้อของ Storage ดั่งที่ได้กล่าวมาแล้วข้างต้น

  • การรวมความสามารถทั้งข้อ 1 และข้อ 2 เข้าด้วยกัน ซึ่ง RP มี Feature ที่เรียกว่า “Concurrent Local and Remote Replication (CLR)” ซึ่งจะสามารถเก็บสำเนาข้อมูลของฝั่งต้นทางโดยใช้ความสามารถของ CDP และนอกจากนั้นยังสามารถส่งข้อมูลเหล่านี้ข้ามไปยังฝั่งปลายทางได้โดยใช้ความสามารถของ CRR ซึ่งทำให้องค์กรสามารถเพิ่มระดับของการปกป้องข้อมูลให้มีประสิทธิภาพมากยิ่งขึ้น


  • ลดต้นทุนในการติดตั้งการกู้คืนระบบจากความเสียหาย เนื่องจาก EMC RecoverPoint สามารถรองรับ Server และ Storage แบบ Multi-Platform ทำให้องค์กรสามารถ Utilize อุปกรณ์ต่าง ๆ ที่มีอยู่แล้วให้ใช้ประโยชน์ได้สูงสุด และนอกจากนี้ด้วยความสามารถในการบีบอัดข้อมูลก่อนการส่งได้ถึง 3-15 เท่า ทำให้ RecoverPoint สามารถช่วยให้องค์กรประหยัดเงินลงทุนเรื่อง WAN Link ได้
     
  • สามารถทำงานร่วมกันได้เป็นอย่างดีกับอุปกรณ์ประเภท Intelligent SAN Switch ไม่ว่าจะเป็นเทคโนโลยีของ Brocade หรือ Cisco ทำให้องค์กรสามารถมีทางเลือกในการเลือกใช้เทคโนโลยีมากขึ้น ไม่จำเป็นต้องผูกติดอยู่กับยี่ห้อใด ยี่ห้อหนึ่ง
     
  • รองรับการเรียกคืนข้อมูล ณ จุดใด ๆ ของข้อมูลได้ (Any Point-in-time recovery) ทำให้เราสามารถเลือกจุดที่เหมาะสมในการเรียกคืนข้อมูลได้ ซึ่งรองรับทั้งการเรียกคืนข้อมูลจากฝั่ง Primary Site และ Disaster Recovery Site
     
  • เพิ่ม Availability และ Performance ให้กับระบบ
     
  • รองรับการ Replicate ข้อมูลได้หลากหลาย Platform ไม่ว่าจะเป็น Server หรือ Storage ทำให้ RecoverPoint เป็นโซลูชั่นที่เหมาะสมกับ Infrastructure ปัจจุบันขององค์กรที่มีหลากหลาย Server, OS และ Storage เทคโนโลยี
     
  • บริหารจัดการระบบได้จากจุดเดียว (Single Console Management) EMC RecoverPoint มีหน้าจอสำหรับ Management แบบ Java-based GUI ทำให้เพิ่มความง่ายและสะดวกสำหรับผู้บริหารระบบในการจัดการ RecoverPoint ได้
ในบทความนี้ได้พูดถึง EMC RecoverPoint แบบคร่าว ๆ เพื่อให้ผู้อ่านได้เห็นคุณสมบัติและประโยชน์ที่จะนำ EMC RecoverPoint ไปใช้งาน ในส่วนของรายละเอียดและคำถามต่าง ๆ ท่านผู้อ่านสามารถติดต่อขอรายละเอียดได้ที่ sophon.ka@g-able.com และหวังเป็นอย่างยิ่งว่า EMC RecoverPoint จะเป็นอีกเทคโนโลยีที่จะช่วยให้องค์กรท่านสามารถกู้คืนระบบจากความเสียหายได้อย่างมีประสิทธิภาพภายใต้การลงทุนที่สมเหตุสมผลครับ

Technical Support
Tel. +66(0)2678-0999
Fax. +66(0)2678-0599
sophon.ka@g-able.com
www.cdgm.co.th




Untitled Document