Cloud Computing

PlAwAnSaI

Administrator
Google Cloud Architect Accelerated Learning Path for AWS professionals:
.
  • In AWS, have been using AWS CloudShell for writing and running bash scripts to manage AWS resources without setting up credentials and installing packages on the multiple local machines use. To reimplement scripts in Google Cloud should use Cloud Shell.

  • In AWS, there is an admin user, Tamara, who manages the organization with an attached policy that allows all IAM actions on all resources within the organization. Could grant similar permissions in Google Cloud by Add Tamara to an admin group that is assigned the roles/resourcemanager.organizationAdmin on the organization.

  • The AWS resource hierarchy uses organizational units to organize accounts, which then contain resources. Could create a similar hierarchy in Google Cloud with Folders, projects, and resources.

  • Alex is a Storage Admin, responsible for managing objects in Cloud Storage. He needs to have the right permissions for every project across the organization. Should Add Alex to a group that has the roles/storage.objectAdmin role assigned at the organizational level.

  • In AWS, there is an IAM role and instance profiles set up for use by a web app to access other services and resources. Need to set up the equivalent environment in Google, should use Google Cloud IAM service account.
.
  • There is an AWS security group that is set up on a VPC, and then associated with instances. If want to replicate this environment in Google Cloud, should use Google firewall rules defined at the network level.

  • If want to connect to Google Workspace and YouTube, but organization cannot meet Google's peering requirements, could use Carrier Peering.

  • AWS VPCs are Regional unless they are peered using VPC peering and contain AZ subnets, while Google Cloud VPCs are global, and contain regional subnets/subnets span regions.

  • A Cloud Router implements dynamic VPN that allows topology to be discovered and shared automatically, which reduces manual static route maintenance.

  • Google Cloud VPC Peering enables to connect two VPC networks from different organizations.

  • There is an AWS EC2 instance without an external IP address assigned, but that connects to AWS services and APIs through an AWS NAT Gateway. If want to configure a similar scenario with a Compute Engine VM, should Use Google APIs and services by enabling Private Google Access on the subnet used by the VM's network interface.
:cool:
 
Last edited:

PlAwAnSaI

Administrator
  • A financial services company receives a regular data feed from its credit card servicing partner. Approximately 5,000 records are sent every 15 mins in plaintext, delivered over HTTPS directly into an Amazon S3 bucket with server-side encryption. This feed contains sensitive credit card Primary Account Number (PAN) data. The company needs to automatically mask the PAN before sending the data to another S3 bucket for additional internal processing. The company also needs to remove and merge specific fields, and then transform the record into JSON format. Additionally, extra feeds are likely to be added in the future, so any design needs to be easily expandable. Solution will meet these requirements is Create an AWS Glue crawler and custom classifier based on the data feed formats and build a table definition to match. Trigger an AWS Lambda function on file delivery to start an AWS Glue ETL job to transform the entire record according to the processing and transformation requirements. Define the output format as JSON. Once complete, have the ETL job send the results to another S3 bucket for internal processing.
    Can use a Glue crawler to populate the AWS Glue Data Catalog with tables. The Lambda function can be triggered using S3 event notifications when object create events occur. The Lambda function will then trigger the Glue ETL job to transform the records masking the sensitive data and modifying the output format to JSON.

  • A company is migrating an app to the AWS cloud. The app runs in an on-premises DC and writes thousands of images into a mounted NFS file system each night. After the company migrates the app, the company will host the app on an Amazon EC2 instance with a mounted Amazon Elastic File System (EFS) file system.
    The company has established an AWS Direct Connect connection to AWS. Before the migration cutover, a solution architect must build a process that will replicate the newly created on-premises images to the EFS file system. The MOST operationally efficient way to replicate the images is Deploy an AWS DataSync agent to an on-prem server that has access to the NFS file system. Send data over the Direct Connect connection to an AWS PrivateLink int.
    AWS DataSync uses to replicate the on-prem images to the EFS file system over the Direct Connect connection. AWS DataSync is a service that automates and accelerates data transfer between on-prem storage systems and AWS storage services. It can transfer data to and from Amazon EFS, FSx for Windows File Server, and S3. To use AWS DataSync, the company needs to deploy an AWS DataSync agent to an on-prem server that has access to the NFS file system. The agent connects to the AWS DataSync service endpoint in the AWS Region where the EFS File system is located. The company can use an AWS PrivateLink interface endpoint to connect to the service endpoint securely and privately over the Direct Connect connection. The company can then create a task in AWS DataSync that specifies the source location (the NFS file system), the destination location (the EFS file system), and the options for the data transfer (such as schedule, bandwidth limit, and verification). AWS DataSync will then perform the data transfer efficiently and securely, using encryption in transit and at rest.
Code:
https://blog.umer-farooq.com/system-design-for-beginners-part-i-getting-started-238d67c76a22
การออกแบบระบบสำหรับผู้เริ่มต้น: ส่วนที่ 1 — การเริ่มต้นใช้งาน

หลายบริษัทใช้การสัมภาษณ์การออกแบบระบบเพื่อทดสอบทักษะการแก้ปัญหาของวิศวกร — คู่มือการออกแบบระบบฉบับสมบูรณ์ในปี 2566

เมื่อเปิด App Taxi ที่ใช้ประจำ จองรถ และเพลิดเพลินกับการสนทนากับเพื่อนๆ ในขณะที่ Taxi พาไปยังจุดหมายปลายทาง รู้มั้ยว่ามีระบบที่ซับซ้อนทำงานอยู่เบื้องหลัง

นี่คือความลับ - ศาสตร์และศิลป์ของการออกแบบระบบ

บทความนี้มีจุดมุ่งหมายเพื่อให้ความเข้าใจที่ชัดเจนเกี่ยวกับการสร้างระบบที่ปรับขนาดได้และแข็งแกร่ง การออกแบบระบบอาจฟังดูน่ากลัว ดังนั้นก่อนอื่นเราจะเข้าใจรากฐานก่อนที่จะพูดถึงหัวข้อที่ซับซ้อน ในบทความแรกของเรา เราจะเจาะลึกลงไปในสี่เสาหลักของการออกแบบระบบ ได้แก่ ประสิทธิภาพ ความสามารถในการปรับขนาด ความน่าเชื่อถือ และความปลอดภัย

ความสำคัญของการสัมภาษณ์การออกแบบระบบ

ปัจจุบันบริษัทด้าน Technology กำลังนำการสัมภาษณ์การออกแบบระบบมาใช้เพื่อประเมินทักษะการวางแผนและการแก้ปัญหาของผู้สมัคร เป้าหมายหลักของการสัมภาษณ์การออกแบบระบบไม่ใช่เพื่อประเมินความรู้เกี่ยวกับ Algorithm หรือการเขียน Code แต่เพื่อทำความเข้าใจความสามารถส่วนบุคคลในการออกแบบระบบที่แข็งแกร่ง ปรับขนาดได้ และมีประสิทธิภาพ ผู้สัมภาษณ์ต้องการประเมินทักษะการสื่อสารของผู้สมัครด้วย พวกเขาต้องการให้ผู้สมัครถามคำถามที่ถูกต้อง ถามข้อกำหนด อธิบายวิธีการเลือกการออกแบบ กล่าวถึงปัญหาคอขวดในสถาปัตยกรรม ฯลฯ

1*tKRSyB8GGeFpaK_5O0Qcjg.jpeg


ความเป็นเลิศในการออกแบบระบบเป็นการเน้นย้ำถึงความเก่งกาจในฐานะนัก Technology และแสดงถึงความสามารถในการเป็นผู้นำโครงการ และ Team งาน ทำให้ทักษะนี้เป็นทักษะที่สำคัญสำหรับผู้ที่อยากทำ Role ที่สร้าง Impact ทาง Technology ที่เปลี่ยนแปลงตลอดเวลา

มาเริ่มกันเลย — การออกแบบระบบครั้งแรก

ลองจินตนาการว่ากำลังใกล้จะเปิดตัว Web Application ใหม่ล่าสุด แล้วเลือกสถาปัตยกรรมที่เรียบง่ายแบบนี้

1*6ySVOJUuyrhMtn-4ofj4pA.png


ก่อนจะดำดิ่งลึกลงไปอีก หยุดที่นี่สักครู่ คุณสามารถมองเห็นข้อผิดพลาดและปัญหาที่อาจเกิดขึ้นในสถาปัตยกรรมได้มั้ย?

ตอนนี้ ให้พิจารณาคำถามเหล่านี้:

ถาม: หน้า Web ของคุณ Load ด้วยความเร็วสูงไม่ว่าจะมีคนเข้าถึงจากที่ไหนก็ตามมั้ย?

ถาม: เมื่อผู้ใช้มีส่วนร่วมในงานที่เกี่ยวข้องกับการเพิ่ม เปลี่ยนแปลง หรือลบข้อมูล (การดำเนินการ CRUD (Create, Read, Update, Delete)) การตอบสนองจะรวดเร็วมั้ย หรือพวกเขาจะหงุดหงิดใจมั้ย?

ถาม: ลองจินตนาการถึงจำนวนผู้ใช้ของคุณที่เพิ่มขึ้นอย่างรวดเร็วจาก 100 คนธรรมดาๆ ไปสู่ 1 ล้านคนในชั่วข้ามคืน ระบบของคุณสามารถยืนหยัดท่ามกลางคำขอรายวันจำนวนมาก (1 ล้านคำขอ/วัน) ได้มั้ย?

ถาม: จะเกิดอะไรขึ้นหาก Service ในเครื่องของคุณ เช่น Backend หรือฐานข้อมูลของคุณ ประสบปัญหาและหยุดทำงาน? ทุกเครื่องอาจพังได้ซักวัน

ถาม: จะเกิดอะไรขึ้นหากฐานข้อมูลของคุณขัดข้องส่งผลให้ข้อมูลสูญหาย?

ถาม: จะเกิดอะไรขึ้นหากมีการโจมตีทาง Cyber บนโครงสร้างพื้นฐาน (Infrastructure) ของคุณ? คุณมีการป้องกันที่เหมาะสมบนโครงสร้างพื้นฐานของคุณมั้ย?

ถาม: จะเกิดอะไรขึ้นหากศูนย์ข้อมูล (Data Center) ทั้งหมดของคุณ (ที่ Application ของคุณ Host อยู่) หยุดทำงานเนื่องจากภัยพิบัติ?

และอื่น ๆ…

4 เสาหลักสำคัญของการออกแบบระบบ

คำถามข้างต้น แม้ว่าจะแตกต่างกันออกไป แต่เกี่ยวข้องกับเสาหลักสี่ข้อนี้:
  1. ประสิทธิภาพ
  2. ความสามารถในการขยายขนาด
  3. ความน่าเชื่อถือ
  4. ความปลอดภัย

ดำดิ่งลงในแต่ละเสาหลักกัน

  1. ประสิทธิภาพ

    ลองนึกภาพการไปร้านค้าและรอ Queue นานเกินไป การดำเนินการที่ Counter อาจช้า หรือพนักงานไม่เพียงพอที่จะรองรับปริมาณลูกค้า ในโลก Digital ความเร็วที่ Website หรือ App ของคุณตอบสนองจะคล้ายกับเวลาที่รอในร้านค้านั่นเอง

    ประสิทธิภาพสามารถกำหนดเป็นตัวชี้วัดว่าระบบ (หรือ Application) ตอบสนองต่อคำขอของผู้ใช้ได้อย่างมีประสิทธิภาพและประสิทธิผล ปัจจัยหลายประการอาจส่งผลต่อประสิทธิภาพของระบบ

    ชนิดและความจุของระบบ:

    ลองนึกภาพทางหลวง ถนนสอง Lane อาจใช้ได้สำหรับเมืองเล็กๆ แต่เมืองที่พลุกพล่านจะต้องใช้ Lane และทางด่วนหลาย Lane เช่นเดียวกับประเภทและความจุของ Hardware และ Software ของคุณ การเลือกประเภทระบบที่ถูกต้องสำหรับงาน ไม่ว่าจะเป็น Server ที่แข็งแกร่งสำหรับ Application ที่มีความต้องการสูงหรือระบบรองสำหรับงานเฉพาะ เป็นสิ่งสำคัญยิ่งในการรับรองประสิทธิภาพสูงสุด

    1*dI6vy241r_3mmSMnXqrwqw.png


    Latency และ Throughput:

    ลองนึกภาพ Latency คือระยะเวลาที่รถยนต์ใช้เดินทางจากจุด A ไปยัง B ในขณะที่ Throughput หมายถึงจำนวนรถยนต์ที่สามารถข้ามจุดตรวจได้ภายในหนึ่งชั่วโมง

    Propagation Delay, การหยุดชะงักในการส่งข้อมูล และเวลาประมวลผล สามารถส่งผลต่อเวลาในการตอบสนองได้ ในทางกลับกัน Throughput อาจได้รับผลกระทบจากขีดจำกัดของ Bandwidth และสภาพของเครือข่าย ด้วยการเพิ่มประสิทธิภาพทั้ง Latency และ Throughput เรามั่นใจว่าผู้ใช้จะได้รับข้อมูลอย่างรวดเร็วในปริมาณที่เพียงพอ
:cool:
 
Last edited:

PlAwAnSaI

Administrator

  1. 1*Q6fCRQYQHWBVJTGnr7eObw.jpeg
    ข้อผิดพลาดในระบบ:

    ลองนึกภาพรถบรรทุกคันหนึ่งเสียกลางถนนที่พลุกพล่านทำให้เกิดความล่าช้า หรือลูกค้าใช้เวลาอยู่ที่ Counter นานขึ้นเพราะบัตร Credit ใช้งานไม่ได้

    1*GggARByPZkKQyf2cxOpEfA.jpeg


    ข้อผิดพลาดในระบบของคุณอาจทำให้เกิดการหยุดชะงักที่คล้ายกัน การตรวจสอบและแก้ไขข้อผิดพลาดอย่างรวดเร็วทำให้การทำงานราบรื่นยิ่งขึ้น

    การใช้ทรัพยากร:

    เหมือนมี Pump น้ำมันบนทางหลวงเพียงแห่งเดียว คนจะหนาแน่นเกินไป ทำให้เกิดความล่าช้า (Delay) เพิ่มขึ้น อย่างไรก็ตาม รถยนต์สามารถเติมน้ำมันและเคลื่อนที่ได้อย่างมีประสิทธิภาพหากมีหลายสถานี

    ทรัพยากรอาจเกิดเป็นคอขวด และระบบอาจทำงานช้าลง ดังนั้น การเพิ่มประสิทธิภาพวิธีใช้ทรัพยากร เช่น หน่วยความจำหรือ CPU จึงเป็นสิ่งสำคัญในการป้องกันปัญหาคอขวด

    1*gg7VT6iXdy_5e-rsvaef-Q.png

    1*9GTB0C6xyB-JvhdQDjeg8g.png

    Concurrency และ Parallelism:

    พิจารณา Concurrency เป็นการจัดการงานหลายอย่างพร้อมกัน เช่น เจ้าหน้าที่ด่านเก็บค่าผ่านทางเพียงคนเดียวที่สลับระหว่าง Lane รถยนต์ได้อย่างมีประสิทธิภาพ ไม่ได้หมายความว่างานต่างๆ เกิดขึ้นพร้อมๆ กัน แต่ระบบได้รับการออกแบบมาให้จัดการงานหลายอย่างได้อย่างมีประสิทธิภาพ

    อย่างไรก็ตาม Parallelism ก็เหมือนกับการมีเจ้าหน้าที่ตู้เก็บค่าผ่านทางหลายราย โดยแต่ละคนประมวลผลรถพร้อมกัน Parallelism หมายถึงงานต่างๆ จะถูกดำเนินการไปพร้อมๆ กัน ส่งผลให้การประมวลผลโดยรวมเร็วขึ้น

    1*b4q_FLe7WZFDZd-ZrN5lsw.jpeg

    ประสิทธิภาพเป็นเรื่องเกี่ยวกับการทำให้แน่ใจว่า Web Application ของคุณทำงานได้อย่างรวดเร็ว มันควรจะเกิดขึ้นทันทีเมื่อมีคน Click ปุ่ม หรือ Load Page หาก Site ของคุณช้า ผู้คนอาจออกไป และไม่กลับมาอีกเลย

  2. ความสามารถในการขยายขนาด:

    ลองนึกภาพร้านอาหารเล็กๆ ที่จู่ๆ ก็ได้รับความนิยม ในตอนแรกจะมีโต๊ะเพียงไม่กี่โต๊ะและมีเมนูจำกัด แต่เมื่อลูกค้าเข้ามามากขึ้นเรื่อยๆ ร้านอาหารก็ต้องขยายที่นั่ง อาจจะเปิดสาขาใหม่ หรือแม้แต่เสนออาหารหลากหลายรสชาติให้มากขึ้น

    ในโลก Digital ความสามารถในการปรับขนาดช่วยให้มั่นใจได้ว่า Application ของคุณเป็นเหมือนร้านอาหารที่ปรับเปลี่ยนได้แห่งนี้ ซึ่งพร้อมเสมอที่จะให้บริการผู้ใช้จำนวนมากขึ้นโดยไม่ทำให้ช้าลงหรือหยุดทำงาน เรามาสำรวจแนวคิดและกลยุทธ์บางอย่างเพื่อให้มั่นใจถึงความสามารถในการขยายขนาดกัน

    Load Balancer:

    ลองนึกถึงผู้จัดการที่นำลูกค้าไปยังส่วนที่พลุกพล่านน้อยกว่า Load Balancer จะกระจายคำขอของผู้ใช้ไปยัง Server หลายเครื่อง ทำให้มั่นใจได้ว่าไม่มี Server ใดถูกใช้งานมากเกินไป มักใช้ในระบบที่ปรับขนาดได้

    1*GmmwXjCMNWk1aE9GR1txTg.png
    Horizontal vs. Vertical Scalability:

    ลองนึกถึงการเพิ่มโต๊ะในร้านอาหาร (แนวนอน) เทียบกับการทำให้แต่ละโต๊ะใหญ่ขึ้น (แนวตั้ง) ความสามารถในการขยายในแนวนอนเกี่ยวข้องกับการเพิ่มเครื่องจักรมากขึ้น ในขณะที่ความสามารถในการขยายในแนวตั้งคือเพิ่มความสามารถของเครื่องเดียว

    1*JNGbgwRDdMKJLMVH82urfA.jpeg


    Auto Scaling:

    การปรับขนาดอัตโนมัติจะปรับจำนวนทรัพยากร เช่น Server ตามปริมาณการใช้งานและความต้องการที่เข้ามา ในช่วงที่มีการรับส่งข้อมูลสูง จะเพิ่มทรัพยากรมากขึ้นเพื่อจัดการกับ Load และเมื่อปริมาณการรับส่งข้อมูลลดลง ก็ลดทรัพยากรลงเพื่อหลีกเลี่ยงความสิ้นเปลือง สิ่งนี้ทำให้มั่นใจได้ว่า Application ของคุณยังคงตอบสนองแม้ในช่วง Peak ที่ไม่คาดคิด ขณะเดียวกันก็คุ้มค่าอีกด้วย

    คุณสามารถตั้งค่า Metric ตามตัวปรับขนาดอัตโนมัติที่จะปรับขนาดโครงสร้างพื้นฐานได้ตลอดเวลา ตัวอย่างเช่น หากการใช้ทรัพยากรของคุณ > 80% เป็นเวลา 2 นาที ให้เพิ่มทรัพยากร และในทำนองเดียวกัน หากการใช้ทรัพยากรยังคง < 50% เป็นเวลา 10 นาที ให้ลบทรัพยากรออก
    0*t_O2mk-afFfbgf5T.jpeg

    Replication:

    เหมือนมี Chef หลายคนในครัวเตรียมอาหารจานเดียวกัน ดังนั้นหากความต้องการอาหารจานนั้นเพิ่มขึ้น คุณจะมี Chef มากขึ้นตามความต้องการ นอกจากนี้ร้านอาหารจะยังคง Serve อาหารจานเดิมต่อไปได้หาก Chef คนใดคนหนึ่งป่วยหรือลาออกไป ในทำนองเดียวกัน การสร้างสำเนาข้อมูลหลายชุด จะทำให้สามารถทนต่อข้อผิดพลาดและเข้าถึงข้อมูลได้เร็วขึ้น

    1*1SyOGRqtG5NOYkjDD0ksLA.jpeg


    Micro-Services:

    คนเหล่านี้เปรียบเสมือน Chef ผู้เชี่ยวชาญในร้านอาหารของคุณ ซึ่งแต่ละคนทุ่มเทให้กับงานเฉพาะด้าน ในด้าน Technology บริการมุ่งเน้นไปที่ Function เฉพาะ และสามารถปรับขนาดได้อย่างอิสระ แต่ละบริการสามารถทำงานได้ด้วยตนเองโดยไม่ต้องพึ่งพาบริการอื่น Service Bus หรือ Message Broker สร้างการเชื่อมโยงระหว่างบริการเหล่านั้นเพื่อการแลกเปลี่ยนข้อมูล

    1*PPvhABjk3EDZmuhHDl5taA.png


    Caching:

    คุณเคยใช้ Drive-Thru ของร้านอาหารบ้างมั้ย? แทนที่จะจอดรถแล้วเดินเข้าไป คุณขับรถมา สั่งอาหาร ชำระเงิน และรับอาหารโดยไม่ต้องลงจากรถ

    ในทำนองเดียวกัน Cache จะเก็บข้อมูลที่ใช้บ่อยเพื่อให้สามารถเรียกได้อย่างรวดเร็ว โดยไม่ต้องเข้าถึงข้อมูลจริงๆ

    1*RwisoRBhv0Sh9yFOBmyr6g.png


    Asynchronous Processes (Queues):

    ลองนึกภาพการส่งข้อความ และทำงานอื่นของคุณต่อไปแทนที่จะรอการตอบกลับ ในการออกแบบระบบ จะคล้ายกับการใช้ Message Queue แทนที่จะให้ผู้ใช้รอให้แต่ละงานเสร็จสิ้นทีละงาน งานจะเรียงกันเป็น Queue ขณะที่ผู้ใช้ทำกิจกรรมอื่น งานเหล่านี้จะได้รับการจัดการอย่างเงียบๆ อยู่เบื้องหลัง สิ่งนี้ทำให้ผู้ใช้ไม่ต้องรอนาน และงานต่างๆ จะได้รับการจัดการอย่างมีประสิทธิภาพ

    1*sQYST9Eqn8RWXr8q97aFwg.png


  3. ความน่าเชื่อถือ:

    ลองจินตนาการว่าคุณกำลังเดินทางด้วยเที่ยวบินระยะไกล ประสบการณ์ที่คุณคาดหวังไม่ใช่แค่เรื่องความรวดเร็วแต่คือความมั่นใจ คุณคาดหวังที่จะไปถึงจุดหมายปลายทางได้อย่างปลอดภัยโดยไม่เจอความปั่นป่วนหรือสถานการณ์ที่ไม่คาดฝัน

    1*hN_Eppbglw4Cl4bAF1GOgg.png


    ในโลก Technology ความน่าเชื่อถือคือความมั่นใจ ช่วยให้มั่นใจได้ว่าระบบของคุณยังคงทำงานอยู่ และแม้ว่าจะเกิดปัญหาขึ้น ระบบก็สามารถกู้คืนได้โดยไม่ทำให้ผู้ใช้ต้องหยุดชะงักมากนัก ต่อไปนี้คือองค์ประกอบหลักของความน่าเชื่อถือ:

    Availability:


    นึกถึงการคาดหวังให้สายการบินมีเครื่องบินสำรองคอย Standby อยู่เสมอ หากเครื่องบินที่เราจะเดินทางมีปัญหา เครื่องบินสำรองก็พร้อมรับประกันว่าผู้โดยสารจะไม่เกิดความล่าช้า ในทำนองเดียวกัน ในการออกแบบระบบ การมี Server หลายตัวกระจายอยู่ในสถานที่ต่างๆ ทำให้มั่นใจได้ว่าหากเครื่องนึง Offline อีกเครื่องนึงจะเข้ามาแทนที่ได้ทันที ทำให้บริการต่างๆ ทำงานได้อย่างราบรื่นสำหรับผู้ใช้งาน

    1*m9YGUz4q3F74QIAFJooeEg.png


    วัดจาก Percent ของเวลาในช่วงเวลาที่กำหนดที่ระบบสามารถทำงานที่ได้รับมอบหมายได้โดยไม่มีความล้มเหลวใดๆ

    Redundancy:

    เครื่องบินมักบรรทุกเชื้อเพลิงเพิ่มเติม หรือมีเครื่องยนต์หลายเครื่องเพื่อสำรอง ใน Digital ระบบก็ควรจะมีระบบสำรองไว้ด้วย สิ่งนี้สามารถเกิดขึ้นได้โดยใช้การ Replicate หรือเตรียมทรัพยากรสำรองให้พร้อม

    Fault Detection:

    นักบินคอย Monitor เครื่องบินโดยใช้เครื่องมือต่างๆ อย่างต่อเนื่อง ในทำนองเดียวกัน ระบบของคุณควรสามารถตรวจจับและแจ้งเตือนความผิดปกติ ได้ทันที ซึ่งมักเกิดขึ้นผ่านเครื่องมือตรวจสอบหลายตัวรวมกัน Heartbeat และ Mechanism ที่คล้ายกันถูกใช้เพื่อตรวจจับบริการอื่น ๆ

    Fault Tolerance:

    เครื่องบินได้รับการออกแบบมาให้บินต่อไปได้แม้ว่าเครื่องยนต์ตัวใดตัวหนึ่งจะขัดข้องก็ตาม ในทำนองเดียวกัน ระบบที่ได้รับการออกแบบมาอย่างดีควรยังคงใช้งานได้แม้จะเผชิญกับความล้มเหลวบางส่วนก็ตาม ในการออกแบบระบบในทางปฏิบัติ ระบบสำรองข้อมูลและ Failover มักจะหมายถึงประเด็นนี้ โดยไม่ให้มีจุดล้มเหลวโดยสิ้นเชิงเพียงจุดเดียว (Single Point of Complete Failure)

    Recovery:

    เมื่อเครื่องบินเผชิญกับสภาวะที่ไม่เอื้ออำนวย เครื่องบินอาจเปลี่ยนเส้นทางไปยังสนามบินอื่น ในทำนองเดียวกัน ระบบ Digital ควรมีแผนในการกู้คืนข้อมูลหรือการดำเนินงานหลังจากเกิดความล้มเหลว การสำรองข้อมูลเป็นประจำ และวิธีการกู้คืน สามารถช่วยในเรื่องนี้ได้

    0*UlwCGyHpoLR1U9jR.png


    ความน่าเชื่อถือสร้างความไว้วางใจและรับรองว่าผู้ใช้จะได้รับประสบการณ์ที่ราบรื่น การออกแบบเพื่อความน่าเชื่อถือ คือการออกแบบเพื่อความไว้วางใจ
:cool:
 
Last edited:

PlAwAnSaI

Administrator



  1. ความปลอดภัย:

    ลองคิดว่า Website หรือ App ของคุณเป็นเหมือนบ้าน คุณจะไม่เปิดประตูบ้านทิ้งไว้ให้ใครเข้ามาใช่มั้ย?

    0*tF1678VnQzG4bSAt.png


    การรักษาความปลอดภัยคือการ Lock ประตูบ้าน Digital ของคุณ ช่วยปกป้อง Website, ข้อมูล และที่สำคัญที่สุด ผู้ใช้ของคุณ จากผู้ไม่ประสงค์ดีบน Internet ที่ต้องการก่อให้เกิดอันตราย การใช้ Protocol ขั้นสูงและเครื่องมือตรวจสอบสามารถทำหน้าที่เหมือนผู้เฝ้าระวัง โดยอนุญาตเฉพาะการรับส่งข้อมูลที่ถูกต้องเท่านั้น ให้เราดูแนวคิดทั่วไปบางประการในระดับสูงดังนี้

    Public Key Cryptography:

    คือระบบ Lock และกุญแจแบบพิเศษ คุณ Share Lock เป็นสาธารณะ แต่มีเพียงคุณเท่านั้นที่มีกุญแจเฉพาะเพื่อเปิดมัน ในระบบ Digital การเข้ารหัส Key สาธารณะช่วยให้เกิดการสื่อสารที่ปลอดภัย โดยมีเพียงผู้รับที่ต้องการเท่านั้นที่สามารถถอดรหัสข้อความได้

    Digital Certificates & Signatures:

    คือตราประทับเอกสารรับรองความถูกต้อง ใบรับรอง Digital รับรองความถูกต้องของ Website ในขณะที่ลายเซ็น Digital รับประกันความสมบูรณ์ของข้อมูลที่ Share ทำให้ผู้ใช้มั่นใจในความน่าเชื่อถือของ Website

    1*Wp93trMbJ32mH0T9DePHdg.png


    HTTPS:

    เหมือนกับการส่งจดหมายปิดผนึกผ่านบริการจัดส่งที่เชื่อถือได้ HTTPS เข้ารหัสข้อมูลระหว่างผู้ใช้และ Website เพื่อให้มั่นใจว่าคนที่สอดรู้สอดเห็นไม่สามารถอ่านข้อความได้

    Firewall:

    จินตนาการถึงกำแพงด้านนอกของปราสาทที่คอยปกป้องผู้รุกราน Firewall ทำหน้าที่คล้ายกัน โดยสร้างกำแพงกั้นระหว่างเครือข่ายภายในที่เชื่อถือได้และภัยคุกคามที่อาจเกิดขึ้นจากภายนอก คุณสามารถควบคุมกฎที่คุณต้องการได้เอง

    Identity & Access Management:

    เหมือน Club พิเศษ เฉพาะผู้ที่อยู่ในรายชื่อแขกเท่านั้นที่สามารถเข้าได้ ไม่ใช่ทุกคน การจัดการข้อมูลประจำตัวทำให้มั่นใจได้ว่าผู้ใช้คือใคร ในขณะที่การจัดการการเข้าถึง รวมถึงการเข้าถึงตามบทบาท และระบบ เช่น OAuth2 จะกำหนดพื้นที่ หรือข้อมูลที่ผู้ใช้สามารถเข้าถึงได้ โดยขึ้นอยู่กับบทบาทหรือสิทธิ์ของผู้ใช้

    Vulnerabilities:

    เช่นเดียวกับจุดอ่อนในป้อมปราการ ผู้โจมตีสามารถโจมตีช่องโหว่ได้ การตระหนักรู้และการป้องกันช่องโหว่ทั่วไป เช่น SQL Injection, การโจมตี Cross-Site Scripting (XSS) หรือการโจมตี Cross-Site Request Forgery (CSRF) เป็นสิ่งสำคัญในการเสริมการป้องกันระบบของคุณ

    เราพึ่งเห็นแค่ยอดภูเขาน้ำแข็ง โดยเฉพาะอย่างยิ่งในเรื่องความปลอดภัย มีแนวคิดอื่นๆ อีกมากมาย แต่สำหรับตอนนี้ ให้เราทำให้มันง่ายที่นี่

กลับมาที่คำถาม

ดู Diagram สถาปัตยกรรมระบบอีกครั้ง! ถามตัวเองด้วยคำถามเดียวกัน มันเพียงพอแล้วหรือยัง?

1*6ySVOJUuyrhMtn-4ofj4pA.png


คำตอบคือ “มันขึ้นอยู่กับ”

ลองนึกถึงการออกแบบระบบเหมือนกับการสร้าง Block คุณไม่จำเป็นต้องมี Block ทุกประเภทสำหรับทุกโครงสร้าง Block บางอันอาจมีราคาแพงหรือใช้เวลาตั้งค่านานกว่า เลือกสิ่งที่เหมาะสมกับโครงการของคุณที่สุด ไม่ใช่ทุกโครงการที่ต้องการทุก Block

ต่อไปนี้คือโครงสร้างพื้นฐานที่สามารถปรับขนาดได้ ไม่ต้องกังวลหากคุณไม่เข้าใจทุกอย่าง อย่างไรก็ตาม สิ่งสำคัญคือต้องทราบถึงความซับซ้อนที่เกี่ยวข้อง

0*pLFZ8_NaAAVb3SQZ.png

การออกแบบระบบที่ได้รับการออกแบบมาอย่างดีและรอบคอบเป็นหัวใจสำคัญของ App และ Website Online เช่นเดียวกับฐานที่แข็งแกร่งของอาคาร องค์ประกอบหลักสี่ส่วน ได้แก่ ประสิทธิภาพ ความสามารถในการขยาย ความน่าเชื่อถือ และความปลอดภัย รวบรวมทุกอย่างไว้ด้วยกัน หากไม่เข้าใจสิ่งเหล่านี้เสียก่อน ก็เหมือนกับการสร้างบ้านบนทรายนั่นเอง

An e-commerce company is revamping its IT infrastructure and is planning to use AWS services. The company's CIO has asked a solution architect to design a simple, highly available, and loosely coupled order processing app. The app is responsible for receiving and processing orders before storing them in an Amazon DynamoDB table. The app has a sporadic traffic pattern and should be able to scale during marketing campaigns to process the orders with minaimal delays. The MOST reliable approach to meet the requirements is Receive the orders in an Amazon SQS queue and invoke an AWS Lambda function to process them.
The best option is to use Amazon SQS and AWS Lambda to create a serverless order processing app.
Amazon SQS is a fully managed message queue service that can decouple the order receiving and processing components, making the app more scalable and fault-tolerant.
AWS Lambda is a serverless compute services that can automatically scale to handle the incoming message from the SQS queue and process them according to the business logic. It can also integrate with Amazon DynamoDB to store the processed orders in a fast and flexible NoSQL DB. This approach eliminates the need to provision, manage, or scale any servers or containers, and reduces the operational overhead and cost.
Using EC2-hosted DB to receive the orders introduces a single point of failure and a scalability bottleneck. EC2 instances also require more mangement and configuration than serverless services.
Using AWS Step Functions to receive the orders adds unnecessary complexity and cost to the app. AWS Step Functions is a service that coordinates multiple AWS services into a serverless workflow, but it is not designed to handle high-volume, sporadic, or unpredictable traffic patterns. It also charges per state transition, which can be expensive for a large number of orders. Launching an ECS container to process each order also requires more resources and management than invoking a Lambda function.
Using Amazon Kinesis Data Streams to receive the orders is not suitable for this use case. Amazon Kinesis Data Streams is a service that enable real-time processing of streaming data at scale, but it is not meant for asynchronous message queuing. It requires consumers to poll the data from the stream, which can introduce latency and complexity. It also charges per shard hour, which can be expensive for a sporadic traffic pattern.
Code:
https://blog.umer-farooq.com/system-design-for-beginners-part-ii-understanding-the-3-tier-architecture-using-everyday-analogies-f2e6537d04af
การออกแบบระบบสำหรับผู้เริ่มต้น - ตอนที่ 2: ทำความเข้าใจสถาปัตยกรรม 3 Tier โดยใช้การเปรียบเทียบในชีวิตประจำวัน:

ก่อนหน้านี้ ในส่วนที่ 1 ของ Serie นี้ เราได้วาง Block พื้นฐานของการออกแบบระบบ ในภาคที่สองของ "การออกแบบระบบสำหรับผู้เริ่มต้น" เราจะแจกแจงสถาปัตยกรรม 3 Tier ทีละชั้น โดยใช้การเปรียบเทียบง่ายๆ และตัวอย่างที่เกี่ยวข้อง

ในตอนท้ายของตอนนี้ คุณควรจะสามารถเข้าใจสถาปัตยกรรมและส่วนประกอบแต่ละอย่างใน Diagram ด้านบนได้ ฟังดูน่าสนใจ? เรามาเริ่มต้นกัน

สถาปัตยกรรม 3 Tier คืออะไร?

ลองนึกภาพการเดินเข้าไปในร้านอาหาร มี Counter สั่งอาหารที่ลูกค้าสั่ง มีห้องครัวที่ Chef เตรียมอาหาร และห้องเก็บของวัตถุดิบ ในโลกของ Technology สถาปัตยกรรม Three-Tier ก็ทำงานในลักษณะเดียวกัน เช่นเดียวกับในร้านอาหาร แต่ละแผนกมีหน้าที่เฉพาะเพื่อให้แน่ใจว่าทุกอย่างดำเนินไปอย่างราบรื่น

1*6wfCLOcjldVF3x49OyCdmQ.png


สถาปัตยกรรม 3-Tier สามชั้น:

สถาปัตยกรรม 3-Tier นั้นทันสมัยและมีสามชั้นดังต่อไปนี้:
  1. Presentation Layer
  2. Logic Layer
  3. Data Layer
:cool:
 
Last edited:

PlAwAnSaI

Administrator
มาเจาะลึกการทำงานของแต่ละ Layer กันดีกว่า

  1. Presentation Layer — Counter สั่งอาหารและบริเวณรับประทานอาหาร:

    คุณเห็น Menu ตัดสินใจว่าคุณต้องการอะไร สั่งซื้อที่ Counter จากนั้นรอรับคำสั่งซื้อของคุณ เมื่อพร้อมแล้ว คุณสามารถรับมันจากการรวบรวม Order และนั่งในบริเวณที่รับประทานอาหารเพื่อเพลิดเพลินกับมื้ออาหารของคุณ

    นี่คือหน้าตาของ App ของคุณ เหมือน Counter สั่งอาหารที่มีแสงสว่างจ้าในร้านอาหารที่คุณชื่นชอบ เป็นสิ่งที่ผู้ใช้เห็นและโต้ตอบด้วย ไม่ว่าจะเป็น Website, App หรือ Interface อื่นๆ

  2. Logic Layer — พื้นที่เตรียมอาหารในครัว:

    เมื่อคุณสั่งซื้อ รายละเอียดจะไปที่บริเวณห้องครัว ซึ่งพนักงานจะทำตามขั้นตอนเฉพาะเพื่อปรุงอาหาร ใส่เครื่องปรุงที่เหมาะสม และบรรจุอาหารของคุณ นี่เป็นพื้นที่ส่วนตัว และไม่อนุญาตให้ลูกค้าเข้าในครัว

    นี่คือตรรกะทางธุรกิจของ App ของคุณ เช่นเดียวกับพนักงานที่อยู่หลัง Counter Layer นี้รับคำขอจาก Presentation Layer ดึงส่วนผสมที่ถูกต้องหรือข้อมูลดิบจาก Data Layer, ประมวลผล จากนั้นจึงบรรจุหีบห่ออย่างเรียบร้อยเพื่อให้ผู้ใช้เห็น

  3. Data Layer — ที่เก็บอาหาร:

    คิดว่านี่คือห้องครัวที่เก็บวัตถุดิบต่างๆ มันเป็นพื้นที่หวงห้าม เฉพาะพนักงานที่ได้รับอนุญาตซึ่งต้องการส่วนผสมในการเตรียมอาหารเท่านั้นที่จะเข้าที่จัดเก็บนี้ได้

    นี่คือ Layer พื้นฐานที่จัดเก็บข้อมูลไว้อย่างปลอดภัย เช่นเดียวกับห้องเก็บของที่มีหน่วยจัดเก็บข้อมูลเพื่อเก็บส่วนผสม Data Layer จะมีฐานข้อมูลและ Solution การจัดเก็บข้อมูลเพื่อรักษาข้อมูลผู้ใช้และ App เมื่อ App ต้องการข้อมูล Layer นี้จะเริ่มทำงาน

การสำรวจสถาปัตยกรรม 3 Tier:

เราได้สัมผัสภาพรวมของสถาปัตยกรรม 3 Tier โดยใช้ตัวอย่างร้านอาหาร ตอนนี้เรามาดูกันดีกว่าว่าเบื้องหลังทุกประสบการณ์ผู้ใช้ Digital มีองค์ประกอบที่ซ่อนอยู่ซึ่งทำให้ทุกอย่างทำงานได้อย่างราบรื่น ให้เราดูรายละเอียดพวกมัน แต่ก่อนหน้านั้นนี่คือภาพที่คุณควรไปอย่างละเอียด

1*mCrmtJYRilwcemb1BxGwUQ.png


  1. ระบบชื่อ Domain (DNS) — สมุดที่อยู่แบบ Dynamic:

    ลองนึกภาพคุณมีเพื่อนที่ย้ายบ้านบ่อยๆ คุณจะต้องตรวจสอบที่อยู่ล่าสุดทุกครั้งที่คุณต้องการไปหา DNS เปรียบเสมือนสมุดที่อยู่ที่ได้รับการ Update อย่างต่อเนื่องซึ่งจะให้ที่อยู่ล่าสุดแก่คุณเสมอ แม้ว่าจะมีการเปลี่ยนแปลงหลังการเข้าชมครั้งล่าสุดก็ตาม

    1*A3A5PZ45C6OQE-nG7SE6Xg.png


    DNS แปลชื่อ Domain ที่เป็นภาษาคน เช่น www.example.com ให้เป็นที่อยู่ IP เช่น 88.56.56.5 ซึ่งอำนวยความสะดวกในการสื่อสารระหว่างเครื่องต่างๆ ที่อยู่ IP ที่เกี่ยวข้องกับชื่อ Domain อาจมีการเปลี่ยนแปลงด้วยเหตุผลหลายประการ ด้วย DNS คุณสามารถเข้าถึง Site ได้อย่างต่อเนื่องโดยใช้ชื่อ Domain เดียวกัน แม้ว่าที่อยู่ IP จะเปลี่ยนไปก็ตาม

    หมายเหตุ: หากคุณ Restart VM (เช่น EC2 ใน AWS) ที่อยู่ IP ของเครื่องอาจเปลี่ยนแปลง หรือเครื่องสามารถทำงานล้มเหลว หรือ Reboot ได้ ซึ่งสามารถเปลี่ยนที่อยู่ IP ของเครื่องได้เช่นกัน

  2. Load Balancer — คนเฝ้าประตู:

    ในงานที่ได้รับความนิยม พนักงานเปิดประตูจะคอยดูแลไม่ให้ทุกคนเข้าไปเบียดเสียดในทางเข้าเดียว พนักงานเปิดประตูจะพาแขกไปยังทางเข้าที่พลุกพล่านน้อยกว่า หากประตูบานใดบานหนึ่งมีคนมากเกินไป เราได้พูดคุยกันแล้วถึงวิธีการใช้ Load Balancer เพื่อให้แน่ใจว่าระบบสามารถปรับขยายได้ในส่วนแรกของ Serie

    เช่นเดียวกับแขกจำนวนมาก คำขอต่างๆ ไหลไปสู่ Event Digital ของเรา — Load Balancer จะตรวจสอบอย่างรวดเร็วและนำแต่ละคำขอไปยัง Web Server ที่เหมาะสมที่สุด (เช่น ที่มี Load น้อยที่สุด)

    1*tm2lThaWjvsq3dZ2AYXj8A.png


    สำหรับข้อมูล Dynamic, Web Server อาจส่งคำขอเพิ่มเติมไปยัง Application Server ผ่านทาง Load Balancer ตัวที่สอง คิดว่ามีคนเฝ้าประตูสองคน คนหนึ่งสำหรับทางเข้าหลัก และอีกคนสำหรับส่วน VIP พิเศษด้านใน ทั้งสองทำงานร่วมกันเพื่อรับประกันการไหลที่ราบรื่น ทำให้มั่นใจได้ว่าแขกทุกคน (หรือคำขอ) จะพบจุดที่สมบูรณ์แบบโดยไม่มีสะดุด

    Load Balancer ยังคอยตรวจสอบสถานะของแต่ละ Server ที่เกี่ยวข้องด้วย หาก Server ล่มหรือไม่ตอบสนอง Load balancer สามารถเปลี่ยนเส้นทางการรับส่งข้อมูลเพื่อให้แน่ใจว่าบริการไม่หยุดชะงัก

    หมายเหตุ: Load Balancer และ Auto Scaling Group สร้าง Team ที่ยอดเยี่ยม Load Balancer กระจายการรับส่งข้อมูลของผู้ใช้ไปยัง Server เพื่อให้แน่ใจว่าสิ่งต่างๆ ทำงานได้อย่างราบรื่น ในเวลาเดียวกัน Auto Scaling Group จะคอยจับตาดู Server เหล่านี้ หากมีผู้ใช้เข้ามาจำนวนมากหรือทำงานช้าลง Auto Scaling Group จะปรับเปลี่ยน มันสามารถเพิ่ม Server ได้มากขึ้นเมื่อ Busy หรือลด Server บางส่วนเมื่อ Load ลดลง

  3. Front End Server (Presentation Layer) — แผนกต้อนรับ:

    ลองนึกภาพการเดินเข้าไปในสำนักงานขนาดใหญ่หรือ Lobby ของโรงแรม ตรงทางเข้าจะมีแผนกต้อนรับ คุณได้รับการต้อนรับ ยื่นแผ่นพับหรือ Brochure และนำไปที่สำนักงานหรือห้อง บางครั้ง หากคุณมาประจำ พนักงานต้อนรับอาจจดจำความต้องการของคุณและแนะนำคุณได้อย่างรวดเร็ว ซึ่งจะทำให้ประสบการณ์ของคุณราบรื่นยิ่งขึ้น

    Frontend Server เปรียบเสมือนแผนกตอนรับของโลก Digital พวกเขา Host Web Interface ที่ผู้ใช้เห็นและโต้ตอบด้วย Browser ของคุณส่งคำขอหน้า Web เช่น https://thaicpe.com Web Server ดึงข้อมูลที่ต้องการและส่งกลับ HTML สำหรับโครงสร้าง, CSS สำหรับ Style และ JavaScript (JS) สำหรับองค์ประกอบเชิงโต้ตอบ เมื่อสิ่งเหล่านี้พร้อมแล้ว Browser ของคุณจะทำหน้าที่ต่อ โดยสร้างมันลงในหน้าที่คุณเห็นและโต้ตอบด้วย

    1*W46KMCKnq5FQbxVFKWBY9Q.png


    สำหรับ Website ที่เปลี่ยนแปลงอยู่ตลอดเวลาตามการโต้ตอบของผู้ใช้ เช่น เมื่อตรวจสอบคำแนะนำส่วนบุคคล หรือ Update Live Feed Browser/อุปกรณ์ของคุณจะเปิดช่องทางการสื่อสารไว้กับ Backend

    หมายเหตุ: เราได้อธิบาย Model การแสดงผลฝั่ง Server ไว้ข้างต้น ตรงกันข้ามกับการแสดงผลฝั่ง Client โดยที่ Web Server ให้ข้อมูลขั้นต่ำที่ Browser ต้องการเท่านั้น จากนั้น Browser จะใช้ JavaScript เพื่อดึงข้อมูลเพิ่มเติมจาก Server โดยตรง Framework เช่น Angular และ React ใช้การ Render ฝั่ง Client
    NextJS เป็น Extension ที่ยอดเยี่ยมสำหรับ React หากคุณต้องการเจาะลึกการ Render ฝั่ง Server

  4. Backend Server (Application Layer) — พื้นที่ทำงานของ Office:

    เมื่อผ่านแผนกต้อนรับไปแล้ว งานจริงก็เกิดขึ้นในห้องทำงานและสำนักงาน นี่คือจุดที่งานเสร็จสมบูรณ์ ประมวลผลเอกสาร และให้บริการต่างๆ

    จุดสำคัญของ Web App Dynamic ทุกตัวคือ Backend Server มันทำงานเป็นเครื่องมือคำนวณ เมื่อผู้ใช้ดำเนินการบน Web App คำขอจะถูกส่งต่อไปยัง Server เหล่านี้ Server โต้ตอบกับฐานข้อมูล โดยดึงข้อมูลดิบที่อยู่ระหว่างการประมวลผล เปลี่ยนให้เป็นข้อมูลที่มีโครงสร้างที่มีความหมาย ข้อมูลนี้จะถูกส่งกลับไปยัง Client

    1*akhs_EWtyr_SrNRNY7lqhA.png


    หมายเหตุ: Backend Server โดยพื้นฐานแล้วเป็นเครื่องที่มีระบบปฏิบัติการเป็นแกนหลัก Platform เช่น AWS EC2 หรือ Azure VMs ช่วยให้คุณสามารถตั้งค่า Server เหล่านี้ได้อย่างง่ายดาย คุณสามารถเลือกระบบปฏิบัติการ โครงสร้างพื้นฐาน Hardware และปรับใช้ตรรกะที่กำหนดเองที่เขียนในภาษาที่คุณเลือกได้ ความยืดหยุ่นนี้ทำให้เกิด Solution ที่ปรับแต่งตามความต้องการของคุณ

  5. ฐานข้อมูล (Data Layer)— ตู้เก็บเอกสาร:

    ทุกสำนักงานมีตู้เก็บเอกสารสำหรับจัดเก็บเอกสารสำคัญเพื่อใช้อ้างอิงในอนาคต ต้องการ File จากสามเดือนที่แล้วมั้ย? ตรวจสอบตู้

    1*Vy7nNTPzkE6FtXuwf4B81A.png


    ในทำนองเดียวกัน ฐานข้อมูลจัดเก็บข้อมูลที่จำเป็นทั้งหมดสำหรับ Website ตั้งแต่ Profile ผู้ใช้ไปจนถึงเนื้อหา เมื่อ Website จำเป็นต้องเรียกคืนข้อมูลที่บันทึกไว้ Website จะดึงข้อมูลจากฐานข้อมูลผ่านบริการ Backend ฐานข้อมูลไม่เปิดให้บุคคลทั่วไปเข้า คุณไม่ต้องการให้ใครมายุ่งกับมัน - ใช่มั้ย?

    1*fYRqSpKFYjqY_9lqoH4tnA.png


    หมายเหตุ: เมื่อพูดถึงฐานข้อมูล คุณมักจะได้ยินเกี่ยวกับ SQL และ NoSQL ฐานข้อมูล SQL เช่น MySQL และ PostgreSQL มีโครงสร้างและใช้ Schema คงที่ ทำให้เหมาะสำหรับการสืบค้นที่ซับซ้อน ในทางกลับกัน ฐานข้อมูล NoSQL เช่น MongoDB และ Cassandra มีความยืดหยุ่นมากกว่าในการจัดเก็บข้อมูล และมีความสามารถในการปรับขนาดได้ดีเยี่ยม ซึ่งมักนิยมใช้กับ Big Data และ App แบบ Real-time
:cool:
 
Last edited:

PlAwAnSaI

Administrator
  1. .
  2. .
  3. .
  4. .
  5. .
  6. Cache — ตัวจัดระเบียบ Desktop:

    ในสำนักงาน คุณมักจะเก็บ File และบันทึกย่อที่ใช้บ่อยที่สุดไว้ใกล้มือเพื่อการเข้าถึงที่รวดเร็ว ทำไม เพราะคุณไม่ต้องการวุ่นวายกับการค้นหามัน

    Cache เป็นส่วนประกอบการจัดเก็บข้อมูลในหน่วยความจำความเร็วสูงที่เก็บชุดย่อยของข้อมูล ซึ่งโดยทั่วไปจะเป็นข้อมูลชั่วคราว (มีอายุสั้น ไม่ถาวร) เพื่อให้คำขอข้อมูลนั้นในอนาคตได้รับการตอบสนองเร็วกว่าการเข้าถึงข้อมูลหลักของสถานที่จัดเก็บข้อมูล

    Cache สามารถใช้ได้ในเกือบทุกองค์ประกอบที่คุณนึกถึง ในด้าน Browser มันเหมือนกับการเก็บ Snapshot Website อย่างรวดเร็ว แทนที่จะ Download ทุกอย่างใหม่ Browser สามารถใช้องค์ประกอบที่ Cache ไว้ ทำให้ Website Load เร็วขึ้น

    1*8h_y4dA53lDLuDXCqyTqaA.png


    สำหรับ Backend การ Cache คือการจดจำคำขอข้อมูลล่าสุด หากผู้ใช้สองคนขอข้อมูลเดียวกัน ทำไมต้องดึงข้อมูลจากฐานข้อมูลสองครั้งแล้วประมวลผลใหม่ Cache Backend จะให้ Cache ทันทีเมื่อขอครั้งที่สอง

    1*gCRq3VEfeu60MBajqXJlVA.png


    สุดท้ายนี้ ในระดับฐานข้อมูล Cache จะป้องกันการดำเนินการซ้ำซ้อน หากมีการเข้าถึงข้อมูลเมื่อเร็วๆ นี้ Cache ฐานข้อมูลจะนำเสนอข้อมูลดังกล่าว ช่วยให้ฐานข้อมูลไม่ต้องทำงานเดิมอีกครั้ง Cache ทั้งหมดเหล่านี้ทำให้ผู้ใช้ปลายทางโต้ตอบได้อย่างราบรื่นและรวดเร็วยิ่งขึ้น

    การเพิ่มประสิทธิภาพด้วย Cache ช่วยเพิ่มประสิทธิภาพ แต่ก็เป็นการลงทุนเช่นกัน การค้นหาจุดที่เหมาะสมระหว่างข้อดีด้านความเร็วและต้นทุนเป็นกุญแจสำคัญในการพิจารณาเพื่อประโยชน์สูงสุด

    หมายเหตุ: การเอาข้อมูลเก่าใน Cache ออกถือเป็นแนวคิดที่สำคัญในวิทยาการ Computer มันเกี่ยวข้องกับการตัดสินใจว่าเมื่อไหร่ควร Update หรือลบข้อมูลออกจาก Cache คำพูดที่มีชื่อเสียงในสาขานี้เน้นย้ำถึงความซับซ้อนว่า: “มีเพียงสองสิ่งที่ยากในวิทยาการ Computer: การเอาข้อมูลเก่าใน Cache ออก และการตั้งชื่อสิ่งต่างๆ”

  7. Regions — เหมือนกับร้านกาแฟที่คุณชื่นชอบ:

    ลองนึกถึงร้านกาแฟหรือร้าน Fast-food ที่คุณชื่นชอบ ไม่ว่าจะเป็น Starbucks หรือ McDonald's พวกเขาสร้างชื่อให้กับตัวเองด้วยการมีสาขาในเมืองต่างๆ ทั่วโลก คุณสามารถเดินเข้าไปในร้านไหนก็ได้เหล่านี้ และแม้ว่าคุณจะอยู่เมืองอื่นหรือแม้แต่ประเทศอื่น แต่ก็ให้ความรู้สึกคุ้นเคย

    1*izwWO7lK4-_CBfR91CDJOg.png


    ในทำนองเดียวกัน ผู้ให้บริการ Cloud ก็สร้างศูนย์ข้อมูลของตนอย่างมีกลยุทธ์ในที่ตั้งทางภูมิศาสตร์ต่างๆ ทั่วโลก สถานที่ที่แตกต่างกันแต่ละแห่งเหล่านี้เรียกว่า 'Region' มันให้ประโยชน์หลายประการ ตัวอย่างเช่น:
    • Data Redundancy: ด้วยการจัดเก็บข้อมูลในหลายภูมิภาค ผู้ให้บริการ Cloud จึงทำให้มั่นใจได้ว่าแม้ว่าจะมีการหยุดทำงานหรือปัญหาในภูมิภาคหนึ่ง ข้อมูลของคุณยังคงปลอดภัยและสามารถเข้าถึงได้จากที่อื่น คุณสามารถเยี่ยมชมร้านอื่นๆ ได้เสมอหากร้าน McDonald's ร้านนึงปิดอยู่

      1*kWS-gei_KiVv_pm3TN6ojg.png


    • Optimized Content Delivery: การมีศูนย์ข้อมูลใกล้กับจุดที่ผู้ใช้อยู่ หมายความว่าข้อมูลเดินทางในระยะทางที่สั้นลง ส่งผลให้ Load เร็วขึ้นและประสบการณ์ผู้ใช้ดีขึ้น คุณอาจจะเลือกร้าน McDonald's ใกล้บ้านคุณมากที่สุด

      1*JYHu3hvgN5gNQLqCfSMWzA.png


      ดังนั้น เมื่อเลือกผู้ให้บริการ Cloud หรือตั้งค่าสถาปัตยกรรม Cloud แนวทางปฏิบัติที่ดีคือ Deploy ใน Region ที่รองรับกลุ่มเป้าหมายของคุณได้ดีที่สุด
      .
  8. VPC (Virtual Private Cloud) — เกาะส่วนตัว:

    ลองนึกภาพหมู่เกาะที่แต่ละเกาะมีเจ้าของคนละคนกัน ทุกเกาะมีความแตกต่าง และมีทรัพยากรเป็นของตัวเอง แต่ละเกาะยังคงเป็นอิสระ โดยปกป้องทรัพยากรและกิจกรรมของตนจากเกาะอื่นๆ หากต้องการค้าขายหรือสื่อสารระหว่างเกาะ พวกเขาจะต้องสร้างการเชื่อมต่อหรือทางเดินตามกฎเกณฑ์บางประการ

    VPC คือพื้นที่เครือข่ายส่วนตัว ภายในสภาพแวดล้อม Cloud มันเป็นที่ปลอดภัยสำหรับทรัพยากร ทำให้มั่นใจได้ว่าพวกมันจะถูกแยกออกจากผู้ใช้รายอื่น ภายใน VPC คุณสามารถควบคุมช่วง IP Subnet (จะกล่าวถึงในเร็วๆ นี้) ทรัพยากร และการกำหนดเส้นทางต่างๆ

    1*OcDKQOJaCpCF-VicJNtCCw.png


    VPC เป็นคำศัพท์เฉพาะสำหรับ AWS หากใช้ Azure คุณจะพบกับคำที่คล้ายคลึงกัน นั่นคือ Azure Virtual Network (VNet)

    คุณสามารถสร้างหลาย VPC ในบัญชีเดียวกันได้ตลอดเวลา ตามค่าเริ่มต้น VPC เหล่านี้ทำงานแยกจากกันและไม่สื่อสารระหว่างกัน หากคุณต้องการให้ VPC สองตัวขึ้นไปแลกเปลี่ยนข้อมูลหรือเชื่อมต่อกัน คุณต้องตั้งค่า 'VPC Peering' กระบวนการนี้สร้างการเชื่อมต่อเครือข่ายโดยตรงระหว่าง VPC ทำให้สามารถโต้ตอบได้โดยไม่ต้องเปิดเผยทรัพยากรของตนสู่ Internet สาธารณะ

    หมายเหตุ: เมื่อสร้างบัญชีใหม่ใน AWS คุณจะได้รับการจัดสรร VPC เริ่มต้นในภูมิภาคของคุณโดยอัตโนมัติ โดย VPC ของคุณจะยังคงไม่ปรากฏให้ผู้ใช้รายอื่นเห็น ทรัพยากรที่คุณจัดเตรียม การตั้งค่าสถาปัตยกรรมของคุณ และกิจกรรมทั้งหมดภายใน VPC ของคุณนั้นเป็นแบบส่วนตัว ทำให้มั่นใจได้ว่าผู้อื่นจะไม่สามารถแอบดูได้ เว้นแต่คุณจะอนุญาตให้พวกเขาเข้าถึง
    .
  9. Availability Zones (AZ) — สถานีไฟฟ้าแยกภายในภูมิภาค:

    ลองนึกถึงเมืองใหญ่ที่มีโรงไฟฟ้าหลายแห่ง หากสถานีนึงหยุดทำงาน สถานีอื่นๆ จะต้องเปิดไฟในเมืองให้สว่างแทน ทุกภูมิภาค Cloud มี AZ หลายแห่ง AZ แต่ละแห่งเปรียบเสมือนที่ตั้งศูนย์ข้อมูลของตัวเอง ซึ่งตั้งค่าให้ทำงานแยกกัน พวกมันทำงานร่วมกันแต่แยกจากกัน หาก AZ อันนึงมีปัญหา งานจะย้ายไปยังอีกอันนึง เพื่อให้แน่ใจว่าบริการต่างๆ ยังคงดำเนินต่อไปได้

    1*hMSMv3n-sPowyGxSgp3Xzg.png


    นี่คือการแสดงภาพแบบครอบคลุมซึ่งจะช่วยให้คุณเข้าใจวิธีการใช้ภูมิภาค และ AZ โดยทั่วไปเพื่อความยืดหยุ่นและ Redundancy

    คุณคิดว่าจะเกิดอะไรขึ้นหาก AZ III หยุดทำงานในภูมิภาค B?

    1*BrcJ_9NfH0XF-Kzc-3zrSg.png


    ใช่! คุณถูก. AZ อีกสองแห่งที่กำลังทำงานอยู่ในภูมิภาคเดียวกัน การรับส่งข้อมูลจะถูกเปลี่ยนเส้นทางไปยังพวกมัน และถ้าทั้งภูมิภาคล่มสลาย - อาจเป็นเพราะสงคราม?

    คุณพูดถูกอีกครั้ง Traffic จะถูกเปลี่ยนเส้นทางไปยังภูมิภาคอื่นและทุกอย่างจะทำงานได้ดียกเว้นว่ามันจะเกิดสงครามด้วย!
    .
  10. Subnet — คุณจะไม่ยอมให้ใครเข้าไปในห้องนอนของคุณ ใช่มั้ย?:

    ลองนึกภาพบ้าน ด้านในจะมีห้องต่างๆ ห้องพักบางห้อง เช่น ห้องนั่งเล่น อาจเข้าถึงได้สำหรับแขก (Subnet สาธารณะ) แต่ห้องอื่นๆ เช่น ห้องนอนของคุณเป็นห้องส่วนตัว อนุญาตให้เฉพาะบางคน :sneaky: เข้าไปได้ - สิ่งเหล่านี้เป็นตัวแทนของพื้นที่ส่วนตัวของเรา (เครือข่ายย่อยส่วนตัว)

    0*vZJbqDpfaKE4P299.jpg


    Subnet ทำหน้าที่เป็น Segment เฉพาะภายใน VPC ซึ่งช่วยคุณจัดระเบียบทรัพยากร Cloud ของคุณ Subnet สาธารณะคือที่ที่คุณมักจะวางองค์ประกอบต่างๆ ที่โต้ตอบกับ Internet โดยตรง เช่น Web Server — คิดว่าสิ่งเหล่านี้เป็นพื้นที่เปิดของที่พักที่ยินดีต้อนรับผู้เยี่ยมชม

    1*B-kvKpL13xZGkW85loZ7Cw.png


    ในทางกลับกัน Subnet ส่วนตัวจะถูกสงวนไว้สำหรับทรัพยากรที่ละเอียดอ่อนหรือสำคัญ เช่น ฐานข้อมูล หรือ Server App เฉพาะ ลองนึกภาพสิ่งเหล่านี้เป็นห้องส่วนตัวของบ้านที่เก็บสิ่งของมีค่าไว้ การแบ่งส่วนทรัพยากรในลักษณะนี้ช่วยเพิ่มความปลอดภัยและช่วยให้การตั้งค่าของคุณเป็นระเบียบ

    เมื่อพูดถึงการสื่อสารภายในเครือข่ายย่อย NAT Gateway เข้ามามีบทบาท เป็นเหมือนตู้ไปรษณีย์พิเศษ อนุญาตให้อุปกรณ์ในเครือข่ายย่อยส่วนตัวส่งจดหมายไปยัง Internet โดยไม่ต้องเปิดเผยที่อยู่บ้าน

การเปรียบเทียบ Cloud — เอกสารสรุป:

Landscape Cloud นั้นกว้างใหญ่ และเต็มไปด้วยตัวเลือกต่างๆ แต่ Amazon Web Services (AWS), Microsoft Azure และ Google Cloud Platform (GCP) เป็นผู้นำ หากต้องการทราบมุมมองที่ชัดเจนยิ่งขึ้นเกี่ยวกับข้อเสนอของพวกเค้า โปรดดูคำแนะนำแบบภาพสำหรับบริการต่างๆ ของพวกเขา

0*6HwnYSjjPpC8YrDq.jpg

:cool:
 
Last edited:

PlAwAnSaI

Administrator
AWS re/Start Grad Training:

  • AWS Hybrid Storage Workshop:
    Code:
    https://github.com/aws-samples/aws-hybrid-storage-workshop

  • Amazon CloudFront use AWS Edge Locations of the AWS Global Infrastructure to ensure low-latency delivery.

  • Can run apps and workloads from a Region closer to the end users to Decrease latency.

  • Networking, storage, compute, and DBs are examples of service categories that AWS offers.

  • AWS Regions are geographic areas that host two or more AZs.

  • Fault tolerant means that the infrastructure has built-in component redundancy and elastic and scalable means that resources dynamically adjust to increases or decreases in capacity requirements.

  • AZs within a Region are connected through low-latency links.

  • A data center can be used for more than one AZ.

  • Each Region is located in a separate geographic area and is a physical location that has multiple AZs.

  • AWS highly recommends provisioning compute resources across multiple AZs.

  • Edge Locations do not need to be located in the same general area as Regions.

  • A company is using Amazon OpenSearch Service to analyze data. The company loads data into an OpenSearch Service cluster with 10 data nodes from an Amazon S3 bucket that uses S3 Standard storage. The data resides in the cluster for 1 month for read-only analysis. After 1 month, the company deletes the index that contains the data from the cluster. For compliance purposes, the company must retain a copy of all input data.
    The company is concerned about ongoing costs and asks a solution architect to recommend a new solution. Solution will meet these requirements MOST cost-effectively is Reduce the number of data nodes in the cluster to 2. Add UltraWarm nodes to handle the expected capacity(, the company can reduce the cost of running the cluster). Configure the indexes to transition to UltraWarm when OpenSearch Service ingests the data (will ensure that the data is stored in the most cost-effective manner). Transition the input data to S3 Glacier Deep Archive after 1 month by using an S3 Lifecycle policy (will ensure that the data is retained for compliance purposes, while also reducing the ongoing costs).

  • Project 1 - 3 Tier Architecture:

    423480345_421626436863826_1947435620708761573_n.jpg


  • In multi-account structure using AWS Organizations, AWS recommends that use the management account and its users and roles only for tasks that can be performed only by that account. Store all of AWS resources in other AWS accounts in the organization and keep them out of the management account. The one exception is that AWS does recommend that enable AWS CloudTrail and keep relevant CloudTrail trails and logs in the management account.
    One important reason to keep resources in other accounts is because Organizations SCPs do not work to restrict any users or roles in the management account.
    Separating resources from management account also help to understand the charges on invoices.

  • A company is migrating a legacy app from an on-premises data center to AWS. The app uses MongoDB as a key-value DB. According to the company's technical guidelines, all Amazon EC2 instances must be hosted in a private subnet without an internet connection. In addition, all connectivity between apps and DBs must be encrypted. The DB must be able to scale based on demand.
    Solution will meet these requirements is Create new Amazon DocumentDB (with MongoDB campatibility) tables for the app with Provisioned IOPS volumes. Use the cluster endpoint to connect to Amazon DocumentDB.
    Amazon DocumentDB (with MongoDB compatibility) can be a key-value DB that can scale based on demand and supports encryption in transit using TLS and at rest using AWS Key Management Servie (KMS). It is a fully managed document DB service that is designed to be compatible with the MongoDB API. It is a NoSQL DB that is optimized for storing, indexing, and querying JSON data. It also supports provisioned IOPS volumes that can scale up to 64 TiB of storage and 256,000 IOPS per cluster. To connect to its, can use the instance endpoint, which connects to a specific instance in the cluster, or the cluster endpoint, which connects to the primary instance or one of the replicas in the cluster. Using the cluster endpoint is recommended for high availability and load balancing purposes.

  • Solution Architect กำลังวางแผนที่จะย้ายฐานข้อมูล Microsoft SQL Server ที่สำคัญไปยัง AWS เนื่องจากฐานข้อมูลเป็นระบบเก่า ไปยังสถาปัตยกรรมข้อมูลสมัยใหม่ โดยจะต้องย้ายฐานข้อมูลโดยมีเวลาหยุดทำงานเกือบเป็นศูนย์
    สามารถใช้ Tool High Availability ของ Native DB เชื่อมต่อระบบต้นทาง (DB เก่า) กับ Instance Amazon RDS สำหรับ Microsoft SQL Server DB และ Configure Replication เมื่อทำการ Replication เสร็จ ก็สามารถเปลี่ยน Workload ไปหา Instance Amazon RDS for Microsoft SQL Server DB ได้เลย
  1. เปลี่ยนงาน(อีกครั้ง)ในวัย 30:
    Code:
    https://nopnithi.medium.com/เปลี่ยนงาน-อีกครั้ง-ในวัย-30-26056c6bdc63
  2. Serverless คืออะไร?:
    Code:
    https://nopnithi.medium.com/serverless-คืออะไร-e5afa2d44506
  3. Check Compliance ของ EC2 ด้วย Chef Inspec และ AWS Systems Manager:
    Code:
    https://nopnithi.medium.com/เช็ค-compliance-ของ-ec2-ด้วย-chef-inspec-และ-aws-systems-manager-ef08c2adebb9
  4. Tool ก็มี…ทำไมยังใช้ Python ทำ Cloud Automation อยู่:
    Code:
    https://nopnithi.medium.com/tool-ก็มี-ทำไมผมยังใช้-python-ทำ-cloud-automation-อยู่-81088fbe7e84
  5. ใช้ AWS Inspector ช่วย Scan ช่องโหว่ Log4j:
    Code:
    https://nopnithi.medium.com/ใช้-aws-inspector-ช่วย-scan-ช่องโหว่-log4j-e1b30fa987c7
  6. Tips and Tricks ในการสมัครใช้งาน AWS Account (Free Tier) เพื่อ Lab:
    Code:
    https://nopnithi.medium.com/tips-and-tricksในการสมัครใช้งาน-aws-account-free-tier-เพื่อ-lab-921c33a54ff8
  7. ใช้ Terraform จัดการหลาย Account, Environment หรือ Cloud Platform:
    Code:
    https://nopnithi.medium.com/use-terraform-with-multi-accounts-environments-or-cloud-platforms-2414030da7f0
  8. ใช้ IAM Policy และ Tag ป้องกันเผลอลบ Resource บน AWS โดยไม่ตั้งใจ:
    Code:
    https://nopnithi.medium.com/use-iam-policy-and-tag-to-prevent-accidental-deletion-of-aws-resources-67595145cd84
  9. บังคับให้ใส่ Tag ทุกครั้งเมื่อสร้าง Resource บน AWS:
    Code:
    https://nopnithi.medium.com/enforce-users-to-specify-tags-when-creating-a-resource-on-aws-cbd43e4202a5
  10. การ Monitoring และ Notification บน AWS Backup (ดีกว่าวิธีของ AWS):
    Code:
    https://nopnithi.medium.com/monitoring-and-notification-for-aws-backup-better-than-aws-methods-7be452f6c872

  1. Code:
    https://www.saladpuk.com/cloud/azure-devops
  2. Code:
    https://www.saladpuk.com/cloud/azure-devops/azure-devops
  3. Code:
    https://www.saladpuk.com/cloud/azure-devops/repository
    • Code:
      https://www.saladpuk.com/basic/git
      Your configuration specifies to merge with the ref 'refs/heads/master'from the remote, but no such ref was fetched.
      Code:
      git config --local branch.master.merge refs/heads/main
      Code:
      https://dotnet.microsoft.com/en-us/download
      fatal: The upstream branch of your current branch does not matchthe name of your current branch.
      Code:
      git config --global push.default current
  4. Code:
    https://www.saladpuk.com/cloud/azure-devops/ci
  5. Code:
    https://www.saladpuk.com/cloud/azure-devops/cd

Azure DevOps Engineer:

  • Any app that runs on Windows can save logs to Blob storage.

  • File system logging automatically turned off after 12 hours because Excessive logging can potentially cause app performance to degrade.
:cool:
 
Last edited:

PlAwAnSaI

Administrator
  • A company is expanding. The company plans to separate its resources into hundreds of different AWS accounts in multiple AWS Regions. A solution architect must recommend a solution that denies access to any operations outside of specifically designated Regions.
    Solution will meet these requirements is Launch an AWS Control Tower landing zone. Create OUs and attach SCPs that deny access to run services outside of the approved Regions.

  • An online retail company is migrating its legacy on-premises .NET app to AWS. The app runs on load-balanced (LB) frontend web servers, LB app servers, and a Microsoft SQL Server DB.
    The company wants to use AWS managed services where possible and does not want to rewrite the app. A solution architect needs to implement a solution to resolve scaling issues and minimize licensing costs as the app scales.
    Solution will meet these requirements MOST cost-effectively is Deploy Amazon EC2 instances in an Auto Scaling group behind an App Load Lalancer (ALB) for the web tier and for the app tier. Use Amazon Aurora PostgreSQL with Babelfish turned on the replatform the SQL Server DB.

  • A company hosts a data-processing app on Amazon EC2 instances. The app polls an Amazon EFS file system for newly uploaded files. When a new file is detected, the app extracts data from the file and runs logic to select a Docker container image to process the file. The app starts the appropriate container image and passes the file location as a parameter.
    The data processing that the container performs can take up to 2 hrs. When the processing is complete, the code that runs inside the container writes the file back to Amazon EFS and exits.
    The company needs to refactor the app to eliminate the EC2 instances that are running the containers. Solution will meet these requirements is Create AWS Lambda container images for the processing. Configure Lambda functions to use the container images. Extract the container selection logic to run as a decision Lambda function that invokes the appropriate Lambda processing function. Migrate the storage of file uploads to an Amazon S3 bucket.
    Update the processing code to use Amazon S3. Configure an S3 event notification to invoke the decision Lambda function when objects are created.
Code:
https://www.devopsmadness.com/aws_solutions_architect_proffesional_cheat_sheet
Multi Account Strategy:

Control Tower:

  • ตั้งค่าและควบคุมสภาพแวดล้อม AWS แบบหลายบัญชีที่ปลอดภัยโดยประสานบริการ AWS หลาย Service (Organizations, Service Catalog, IAM) ในนามของคุณ ในขณะเดียวกันก็รักษาความต้องการด้านความปลอดภัยและการปฏิบัติตามข้อกำหนด (Compliance) ของ App ของคุณ

  • ปรับใช้การควบคุมถิ่นที่อยู่ของข้อมูลและปฏิเสธการใช้ข้อมูลนอกภูมิภาคที่ระบุ

  • สร้าง Landing Zone ซึ่งเป็นสภาพแวดล้อม AWS แบบหลายบัญชีที่ออกแบบมาอย่างดี โดยอิงตามแนวทางปฏิบัติที่ดีที่สุดด้านความปลอดภัยและการปฏิบัติตามข้อกำหนด

  • หลังจากการตั้งค่า Landing Zone คุณสามารถกำหนดค่า IAM Identity Center ด้วย Directory ที่รองรับ เช่น AWS Managed Microsoft AD

  • Account Factory จะจัดสรรบัญชีใหม่ในองค์กรของคุณโดยอัตโนมัติ โดยได้รับการกำหนดค่าล่วงหน้าให้ตรงกับความต้องการของคุณ

  • Guardrails เป็นกฎการกำกับดูแลที่บรรจุไว้ล่วงหน้าสำหรับการรักษาความปลอดภัย การดำเนินงาน และการปฏิบัติตามข้อกำหนด ซึ่งคุณสามารถเลือกและนำไปใช้ทั่วทั้งองค์กรหรือกับกลุ่มบัญชีเฉพาะได้ (SCP, CloudFormation, Config, Dashboard) บังคับ (Mandatory), เชิงป้องกัน, ตรวจสอบ หรือทางเลือก

  • Dashboard ช่วยให้คุณมองเห็นสภาพแวดล้อม AWS ของคุณได้อย่างต่อเนื่อง

  • Integrate รวมกับเครื่องมือ 3rd Party เพื่อเพิ่มขีดความสามารถ

  • หากต้องการย้ายบัญชีไปยัง Oraganization จาก Management Account ให้สร้างคำเชิญไปยังบัญชีอื่นและรอให้เค้ายอมรับคำเชิญ

  • ไม่มีค่าใช้จ่ายเพิ่มเติมในการใช้ AWS Control Tower แต่เมื่อคุณตั้งค่า AWS Control Tower คุณจะเริ่มมีค่าใช้จ่ายสำหรับบริการของ AWS ที่กำหนดค่าเพื่อตั้งค่า Landing Zone และ Mandatory Guardrails.
Code:
https://www.trueidc.com/th/article-detail/64/TrueIDC-AWS-Landing-Zone-Best-Practice
  • Retrieve file system logs using Azure CLI:
    Code:
    az webapp log download --log-file contosofashions.zip  --resource-group learn-cb98e573-f681-4b18-a466-25eb122c1c3a --name contosofashions12851
    Code:
    zipinfo -1 contosofashions.zip
    Code:
    unzip -j contosofashions.zip LogFiles/Application/*.txt
    Code:
    code *.txt
    Ctrl+Q to close

  • Not all resources support tags, so will want to confirm that resource type supports them.

  • Tags are not inherited. Tags need to be applied to every supported resource that want tagged.

  • Resource groups can be nested.

  • The following approaches are a good usage/ways of Using tags:
    • to associate a cost center with resources for internal chargeback.
    • in conjunction with Azure Automation to schedule maintenance windows.
    • to store environment and department association.
      .
  • The most efficient way to ensure a naming convention was followed across subscription is Crate a policy with naming requirements and assign it to the scope of subscription.

  • An ExpressRoute circuit with connectivity back to on-premises network would be good use of a resource lock.

  • An Azure Spring Apps cluster can also be created using the Azure portal.

  • The name of an Azure Spring Apps cluster should be unique across all of Azure.

  • On Azure Spring Apps, Spring Cloud Config Server can access Git repositories that are public, secured by SSH or using HTTP basic authentication.

  • Using Spring Cloud Config is a great solution because:
    • It uses Git, so configuration data can be tagged or rolled back.
    • Configuration is stored in a specific Git repository, which can be secured separately.
    • It provides a centralized place to store all configuration data, for all microservices.
    • It allows storing sensitive parameters (like DB password) outside of application.
      .
  • Will research performance capability in Azure because The team needed to perpare for performance target negotiations.
    It's crucial that well prepared for negotiations. Understanding platform's capabilities before begin negotiating will help set realistic targets that are achievable.

  • The anticipated growth pattern of the workload is an important factor to include when working on identifying performance targets.

  • Identifying workload flows and their performance targets is a more effective way/contextualized to ensure that critical functions of the workload are designed appropriately, not individual resources.

  • In the context of designing to meet capacity requirements, one way that can choose the right resources for workload is Consider features that can fulfill the scalability requirements of workload.
    Being able to take advantage of built-in scaling features is a great design choice that can help meet capacity requirements.

  • Predictive modeling can help forecast the future capacity requirements of workload.

  • High latency communicating with on-premises IoT devices might affect compute requirements, so have to test the hypothesis.

  • Should test performance throughout the dev lifecycle, including production.

  • It is important to monitor both real and synthetic transactions workload to ensure that performance during real-world usage is acceptable.

  • If saw some inefficiencies in DB structure that could cause performance issues as the workload's usage increses, should planning on changing the DB structure.

  • By dedicating time during each cycle to address performance issues, the team will able to address longstanding issues and continuously improve the efficiency of workloand.

  • Implement new design patterns and components can boost performance in ways that may not be possible with current design.

  • An app performance monitoring tool can help analyze performance trends and identify execution bottlenecks.
:cool:
 
Last edited:

PlAwAnSaI

Administrator
  • A company runs an IoT platform on AWS IoT sensors in various locations send data to the company's Node js API servers on Amazon EC2 instances running behind an ALB. The data is stored in an Amazon RDS MySQL DB instance that uses a 4 TB General Purpose SSD volume. The number of sensors the company has deployed in the field has increased over time and is expected to grow significantly. The API servers are consistently overloaded and RDS metrics show high write latency. To resolve the issues permanently and enable growth as new sensors are provisioned should:
    Leverage Amazon Kinesis Data Streams and AWS Lambda to ingest and process the raw data. Amazon Kinesis Data Streams is a serverless streaming data service that simplifies the capture, processing, and storage of data streams at any scale. It can handle any amount of streaming data and process data from hundreds of thousands of sources with very low latency. AWS Lambda is a serverless compute service that lets run code without provisioning or managing servers. It can be triggered by Kinesis Data Streams events and process the data records in real time. It can also scale automatically based on the incoming data volume. By using them, the company can reduce the load on the API servers and improve the performance and scalability of the data ingestion and processing layer.
    And Re-architect the DB tier to use Amazon DynamoDB instead of an RDS MySQL DB instance. It is a fully managed key-value and document DB that delivers single-digit milisecond performance at any scale. It supports auto scaling, which automatically adjusts read and write capacity based on actual traffic patterns. It also supports on-demand capacity mode, which instantly accommodates up to double the previous peak traffic on a table. By using itinstead of RDS MySQL DB instance, the company can eliminate high write latency and improve scalability and performance of the DB tier.

  • A company is developing a new serverless API by using Amazon API Gateway and AWS Lambda. The company integrated the Lambda functions with API Gateway to use several shared libraries and custom classes. A solution architect needs to simplify the deployment of the solution and optimize for code reuse.
    Solution will meet these requirements is Deploy the shared libraries and custom classes to a Docker image. Upload the image to Amazon Elastic Container Registry (ECR). Create a Lambda layer that uses the Docker image as the source. Then, Deploy the API's Lambda functions as Zip packages. Configure the packages to use the Lambda layer.
    A Lambda layer is a distribution mechanism for libraries, custom runtimes, and other function dependencies. It allows to mange in-dev function code separately from dependencies, this way can easily update dependencies without having to update entire function code.
    By deplying the shared libraries and custom classes to a Docker image and uploading the image to Amazon ECR, it makes it easy to manage and version the dependencies. This way, the company can use the same version of the dependencies across different Lambda functions.
    By creating a Lambda layer that uses the Docker image as the source, the company can configure the API's Lambda functions to use the layer, reducing the need to include the dependencies in each function package, and making it easy to update the dependencies across all functions at once.

  • A company is migrating a document processing workload to AWS. The company has updated many apps to natively use the Amazon S3 API to store, retrive, and modify docs that a processing server generates at a rate of approximately 5 docs every second. After the doc processing is finished, customers can download the docs direcly from Amazon S3.
    During the migration, the company discovered that it could not immediately update the processing server that generates many docs to support the S3 API. The server runs on Linux and requires fast local access to the files that the server generates and modifies. When the server finishes processing, the files must be available to the public for download within 30 mins.
    Solution will meet these requirements with the LEAST amount of effort is Configure Amazon FSx for Lustre with an import and export policy. Link the new file system to an S3 bucket. Install the Lustre client and mount the doc store to an Amazon EC2 instance by using NFS.
    Amazon FSx for Lustre is a fully managed service that provides cost-effective, high-performance, scalable storage for compute workloads. Powered by Lustre, the world's most popular high-performance file system, it offers shared storage with sub-ms latencies, up to terabytes per sec of throughput, and millions of IOPS. It can also be linked to Amazon Simple Storage Service (S3) buckets, allowing to access and process data concurrently from both a high-performance file system and from the S3 API.

  • Use Azure CLI to deploy a web app:
    Code:
    gitRepo=https://github.com/MicrosoftDocs/mslearn-capture-application-logs-app-service
    appName="contosofashions$RANDOM"
    appPlan="contosofashionsAppPlan"
    resourceGroup=learn-cb98e573-f681-4b18-a466-25eb122c1c3a
    storageAccount=sa$appName
    appLocation=southeastasia
    Code:
    az appservice plan create --name $appPlan --resource-group $resourceGroup --location $appLocation --sku FREE
    az webapp create --name $appName --resource-group $resourceGroup --plan $appPlan --deployment-source-url $gitRepo
    Code:
    contosofashions12851.azurewebsites.net
    Code:
    az storage account create -n $storageAccount -g $resourceGroup -l $appLocation --sku Standard_LRS

  • Use Azure CLI to view the live log stream:
    Code:
    az webapp log tail  --resource-group learn-cb98e573-f681-4b18-a466-25eb122c1c3a --name contosofashions12851
    Ctrl+C to stop

  • Using a common toolset ops and dev teams can make it easier to share knowledge and collaborate by reducing the number of communication and collaboration methods/issues.

  • Blameless postmortems is an example of building a continuous learning and experimentation mindset. They are a key component of DevOps culture and are used to learn from incidents and improve processes.

  • Lacking of standardization in toolset could affected productivity and quality.

  • Azure DevOps Boards is an example of an industry-standard tool for maintaining a backlog.

  • Testing early and often in the dev cycle helps dev velocity and efficiency by catching bugs early and reducing the cost of fixing them.

  • Azure DevOps provides reporting features that can help measure velocity and identify areas for improving quality and efficiency.

  • Adding additional monitoring to the app allow the team to identify the root cause.

  • Dashboards should be designed to provide the right information to the right people. This means that each team should have their own dashboard that provides the information they need to do their job.

  • Alerts should be actionable, not informational.

  • Deploying Infrastructure as Code (IaC) help deploy with confidence. It allows to consistently and repeatedly deploy workload, cutting down the risk of human error.

  • By moving the IaC code to the same repository as the app code, the team will cut down the risk of security or governance issues by applying the same standards across both codebases.

  • Using a common deployment manifest across workload environments ensures that DR environment mirrors primary environment, can be deployed quickly, and will go efficiently.

  • The doc available for the task is important, but shouldn't be a deciding factor when evaluating it for automation.

  • Automation is integral to the workload, and should be maintained with the same standards as the rest of the workload components for all WAF pillar areas.

  • A fundamental principle of safe deployment practices is All deployments should be automated through pipelines. This ensures that deployments are consistent and repeatable.
:cool:
 
Last edited:

PlAwAnSaI

Administrator
  • A company is migrating to the cloud. It wants to evaluate the configurations of VMs in its existing DC environment to ensure that it can size new Amazon EC2 instances accurately. The company wants to collect metrics, such as CPU, memory, and disk utilization, and it needs an inventory of what processes are running on each instance. The company would also like to monitor network connections to map communications between servers.
    Would enable the collection of this data MOST cost effectively is Use AWS App Discovery Service and deploy the data collection agent to each VM in the DC.
    The AWS App Discovery Service can help plan migration projects by collecting data about on-premises servers, such as configuration, performance, and network connections. The data collection agent is a lightweight software that can be installed on each server to gather this information. This option is more cost-effective than agentless discovery, which requires deploying a virtual appliance in the VMware environment, or using CloudWatch agent, which incurs additional charges for CloudWatch Logs. Scanning the servers over a VPN is not a valid option for AWS App Discovery Service.

  • A company has a legacy app that runs on multiple .NET Framework components. The components share the same Microsoft SQL Server DB and communicate with each other asynchronously by using Microsoft Message Queueing (MSMQ).
    The company is starting a migration to containerized .NET Core components and wants to refactor the app to run on AWS. The .NET Core components require complex orchestration. The company must have full control over networking and host configuration. The app's DB model is strongly relational. Solution will meet these requirements is Host the .NET Core components on Amazon Elastic Container Service (ECS) with the Amazon EC2 launch type. Host the DB on Amazon Aurora MySQL Serverless v2. Use Amazon Simple Queue Service (SQS) for asynchronous messaging.
    Amazon ECS is a fully managed container orchestration service that supports both AWS Fargate and Amazon EC2 as launch types. The Amazon EC2 launch type allows users to choose their own EC2 instances, configure their own networking settings, and access their own host OS.
    Hosting the DB on Amazon Aurora MySQL Serverless v2 will have a strongly relational DB model and using the same DB engine as SQL Server. MySQL is a compatible relational DB engine with SQL Server, and it can support most of the legacy app's DB model. Amazon Aurora MySQL Serverless v2 is a serverless version of Amazon Aurora MySQL that can scale up and down automatically based on demand.
    Using Amazon SQS for asynchronous messaging provides a compatible replacement for MSMQ, which is a queue-based messaging system. It is a fully managed message queuing service that enables decoupled and scalable microservices, distributed systems, and serverless apps.

  • A company has used IaC to provision a set of two Amazon EC2 instances. The instances have remained the same for several years. The company's business has grown rapidly in the past few months. In response the company's operations team has implemented an Auto Scaling group to manage the sudden increases in traffic. Company policy requires a monthly installation of security updates on all OS that are running.
    The most recent security update required a reboot. As a result, the Auto Scaling group terminated the instances and replaced them with new, unpatched instances. To avoid a recurrence of this issue a solution architect should recommend to Create an Elastic Load Balancer in front of the Auto Scaling group. Configure monitoring to ensure that target group health checks return healthy after the Auto Scaling group replaces the terminated instances. And Create automation scripts to patch an AMI, update the launch configuration, and invoke an Auto Scaling instance refresh.
Code:
https://www.youtube.com/watch?v=GVWBT_n6fI8

S3 Storage Classes:​

Storage Class​
Features​
S3 StandardDefault
S3 Intelligent TieringAutomatically move data to most cost-effective storage tier, by monitoring access patterns.
Used when access patterns are not known.
S3 Standard-Infrequent Access (IA)For Long lived less frequently access data.
Charged for minimum 30 days.
S3 One Zone - IAStores data in One AZ Only.
Less expensive than standard IA.
S3 Glacier Instant RetrievalArchive rarely accessed data. Quick Retrieval.
Minimum storage period of 90 days.
S3 Glacier Deep ArchiveArchive rarely accessed data. Lowest cost data archiving.
Retrieval time in hours.
  • A company has app services that have been containerized and deployed on multiple Amazon EC2 instances with public IPs. An Apache Kafka cluster has been deployed to the EC2 instances. A PostgreSQL DB has been migrated to Amazon RDS for PostgreSQL. The company expects a significant increase of orders on its platform when a new version of its flagship product is released.
    Changes to the current architecture will reduce operational overhead and support the product release is Deploy the app on Amazon Elastic Kubernetes Service (EKS) with AWS Fargate and enable auto scaling behing an ALB. Create additional read replicas for the DB instance. Create an Amazon Managed Streaming for Apache Kafka cluster and configure the app services to use the cluster. Store static content in Amazon S3 behind an Amazon CloudFront distribution.​

Storage Types:​

Storage Type​
Key Features​
Amazon EFSScalable, Shared file storage
Multiple EC2 access
, Regional availability
Amazon EBSBlock Storage for EC2 instances
Persistent, durable volumes, Granular control, Snapshots
Limitations
around attaching it to multiple EC2 instances
Amazon S3Object storage, Highly durable, scalable
Various storage classes, Versatile and Cost-Effective
EC2 Instance StoreTemporary block storage attached to EC2 instance
High I/O performance, Data lost on instance termination
Amazon FSxManaged file storage for Windows/Linux
High-performance
file systems


  • A recommended deployment strategy is Prefer small, frequent deployments are less risky and easier to roll back.

  • Feature flags allow to gradually/control expose new features to users, and to roll back the features if necessary.

  • Azure Monitor collect Data from a variety of sources, such as the app event log, the operating system (Windows and Linux), Azure resources, and custom data sources. It collects two types of data: metrics and logs. Metrics are numerical values that describe some aspect of a system at a particular time. Logs contain different kinds of data, such as event information, organized into records.

  • If a Web site seems slow, it is often because the Web server is receiving more traffic than it can handle. Request wait time is a common metric used to determine whether a server is overloaded.
:cool:
 
Last edited:

PlAwAnSaI

Administrator
  • A solution architect is creating an app that stores objects in an Amazon S3 bucket. The solutions architect must deploy the app in two AWS Regions that will be used simultaneously. The objects in the two S3 buckets must remain synchronized with each other.
    Steps will meet these requirements with the LEAST operational overhead are:​
    • Create an S3 Multi-Region Access Point. Change the app to refer to the Multi-Region Access Point
    • Configure two-way S3 Cross-Region Replication (CRR) between the two S3 buckets
    • Enable S3 Versioning for each S3 bucket

Amazon FSx file system:
File System​
Features​
Amazon FSx for LustrePOSIX compliant, suitable for linux systems
Fully managed, high performant file system.
Amazon FSx for Windows File ServerWindows native support, SMB protocol support
Fully managed, high performant file system built on Windows Server.

From Zero to Docker - Tutorial for Beginners:




Code:
https://www.hava.io/blog/cattle-vs-pets-devops-explained

ฝูงวัวกับสัตว์เลี้ยง - อธิบาย DevOps:
DevOps.jpg

การเปลี่ยนแปลงและพัฒนาการของรูปแบบการให้บริการด้านปฏิบัติการ (Operational Service Models):

หนึ่งในแนวคิดหลักของ DevOps คือการเปรียบเทียบระหว่าง ฝูงวัว กับ สัตว์เลี้ยง เพื่ออธิบายรูปแบบการให้บริการและความสำคัญของสถาปัตยกรรมใน Environment Cloud ของคุณ

สัตว์เลี้ยง:

Model Service "สัตว์เลี้ยง" หมายถึงการจัดการทรัพยากรแบบเฉพาะเจาะจง ให้ความสำคัญกับแต่ละทรัพยากร/Server มีการตั้งชื่อ ดูแลเป็นพิเศษ เอาใจใส่อย่างดี ได้รับการเลี้ยงดูด้วยความรัก เหมือนเป็นสัตว์เลี้ยงในครอบครัวที่ซื่อสัตย์ Zeus, Apollo, Athena

เมื่อพวกมันเริ่ม Fail หรือหยุดการทำงาน คุณจะต้องดูแลพวกมันให้กลับมาแข็งแรงขึ้นมาใหม่อีกครั้ง ขยายขนาดเป็นครั้งคราว

ในฐานะ Mainframe, Service เดี่ยว, Server ฐานข้อมูล หรือ Load Balancer, เมื่อ Zeus หายตัวไป ทุกคนก็สังเกตเห็น

ฝูงวัว:

ในทางกลับกัน ฝูงวัวไม่ได้รับการดูแลด้วยความรักเหมือนกับ Zeus หรือ Apollo โดยทั่วไปแล้ว Model บริการนี้จะ Tag Server เช่น svr01 svr02 svr03 ฯลฯ เช่นเดียวกับการใช้ Tag หูของวัว พวกมันทั้งหมดได้รับการกำหนดค่าค่อนข้างเหมือนกัน ดังนั้นเมื่อตัวนึงป่วย คุณก็สามารถแทนที่มันด้วยตัวอื่นโดยไม่ต้องคิดเลย จัดการทรัพยากรแบบกลุ่ม ไม่ได้ให้ความสำคัญกับตัวทรัพยากรใดทรัพยากรหนึ่งโดยเฉพาะ เน้นที่จะจัดการให้ระบบโดยรวมทำงานได้อย่างราบรื่น

การใช้งานทั่วไปของการกำหนดค่าแบบฝูงวัวจะเป็นพวก Array ของ Web Server, Cluster การค้นหา, Cluster NoSQL, พื้นที่เก็บข้อมูล, และ Cluster Big-data

เนื่องจากการนำ Server ปศุสัตว์แบบ Rack Bare metal มาใช้ทั้งภายในองค์กรหรือในศูนย์ข้อมูลเริ่มได้รับความนิยม ความต้องการระบบอัตโนมัติในการควบคุม Server จึงมีความสำคัญเช่นกัน เครื่องมืออย่าง Puppet และ Chef เลยช่วยให้ Ops กำหนดค่ากลุ่ม "ปศุสัตว์" ได้โดยใช้ระบบอัตโนมัติ

Cloud IaaS - Dawn แห่งยุคใหม่:

ด้วยการถือกำเนิดของ Infrastructure as a Service (IaaS) นักพัฒนาและทีมปฏิบัติการจึงสามารถเข้าถึงโครงสร้างพื้นฐาน IT แบบ Virtualize ทั้งหมดได้ ในปี 2549 ระบบเครือข่าย พื้นที่เก็บข้อมูล การประมวลผล หน่วยความจำ และ CPU ทั้งหมดพร้อมใช้งานผ่าน AWS ตามมาด้วย Microsoft Azure ไม่กี่ปีต่อมาในปี 2553 และ GCP ในปี 2554

วัวตัวเดียวกันใน (Server) Farm ของคนอื่น

ความจำเป็นในการดำเนินการและประสานการกำหนดค่าและการปรับใช้ Solution ระบบ Cloud โดยอัตโนมัติทำให้เกิดเครื่องมือต่างๆ เช่น Salt Stack, Ansible และ Terraform เครื่องมือเหล่านี้ช่วยให้นักพัฒนาและฝ่ายปฏิบัติการ (DevOps) สามารถปรับใช้โครงสร้างพื้นฐานที่จำเป็นต่อการสนับสนุน App ของคุณ - กระบวนการที่ปัจจุบันรู้จักกันในชื่อ "IaC"

ในขณะที่การ Virtualize ของ Environment เพื่อรองรับ App ต่างๆ นั้นเป็นไปโดยอัตโนมัติอย่างสมบูรณ์ ความสามารถในการ Pack App และโครงสร้างพื้นฐานในการทำให้ App Deploy บนไหนก็ได้โดยไม่คำนึงถึง Hardware หรือ Technology Cloud นั้นถูกมองว่าเป็นวิวัฒนาการขั้นต่อไป Solution ในช่วงแรกๆ เช่น Linux, Container, OpenVZ และ Docker มอบความสามารถในการแยก App ออกใน Environment ต่างๆ โดยไม่จำเป็นต้อง Virtualize Hardware อีก

Container ได้รับความนิยมอย่างมาก Docker ก็พัฒนาไปสู่ Ecosystem ของตัวเอง และ Technology มากมายที่มุ่งจัดสรรทรัพยากรให้กับ Container และ Deploy ข้ามกลุ่ม Cluster ของ Server แบบปศุสัตว์ รวมถึง Kubernetes, Apache Mesos, Swarm และ Nomad ก็มีให้ใช้งานอีกด้วย

เกิดอะไรขึ้นกับสัตว์เลี้ยง?:

พวกมันยังมีชีวิตอยู่และสบายดี จำเป็นต้องมีการเปลี่ยนแปลง Run-time และการกำหนดค่าของ App Server ที่จัดการภายในหรือในระบบ Cloud, Terraform, Ansible และ Chef ยังคงดูเหมือน Platform ยอดนิยมที่ DevOps เลือกใช้เพื่อจัดการและ Deploy IaC

การใช้ Container เพื่อ Deploy App:

สำหรับ Team ที่ใช้โครงสร้างพื้นฐานแบบ Container ตอนนี้ Kubernetes ดูเหมือนจะเป็นเครื่องมือเริ่มต้นในการ Deploy App บน Platform Cloud สามเจ้าใหญ่

Google Kubernetes Engine (GKE), Azure Container Service (AKS) และ AWS EKS ล้วนเป็นการใช้งานบริการกำหนด Schedule ของ Kubernetes

Config Management (CM) vs Container Orchestration (CO):

Ansible จะเป็นหนึ่งในเครื่องมือ CM ที่ได้รับความนิยมมากที่สุดที่ใช้และความรู้พื้นฐานจะเป็นประโยชน์ในการใช้งาน อย่างไรก็ตาม ทักษะขั้นสูงที่จำเป็นในการควบคุม CO อย่างเชี่ยวชาญ, Docker ถือเป็นมาตรฐาน Container อย่างมากในขณะนี้ และ CO คือ Kubernetes

อาจต้องใช้เวลา 6 เดือนในการทำความคุ้นเคยกับพื้นฐานของ Kubernetes อย่างเต็มที่ Kubernetes เป็นเครื่องมือที่ได้รับความนิยมและถูกระบุในการรับสมัครงานมากกว่าเครื่องมืออื่นๆ เมื่อบริษัทต่างๆ กำลังรับสมัครวิศวกร DevOps ซึ่งถือว่าคุ้มค่าสำหรับการเรียนรู้

Terraform ก็เป็นทักษะที่ต้องมีเช่นกัน การมีทักษะในการขับเคลื่อนเครื่องมือที่ใช้ IaC ถือเป็น Bonus ที่ดีอย่างแน่นอน โดยเฉพาะอย่างยิ่งเมื่อเครื่องมืออย่าง Terraform มีใน Ops สมัยใหม่เกือบทุกตัว คุณไม่จำเป็นต้องเป็นผู้เชี่ยวชาญ แต่ก็เป็นทักษะที่วิศวกร DevOps ระดับกลางทุกคนจะต้องมี

Continuous Integration / Continuous Delivery (CI / CD):

ด้วยการ Deploy App อัตโนมัติทั่วทั้ง Cluster ของ Container ที่เป็นอิสระจาก Hardware พื้นฐาน นักพัฒนาจึงมีโอกาสที่จะส่งการเปลี่ยนแปลง Code ได้บ่อยและน่าเชื่อถือได้มากขึ้น CI/CD คือแนวปฏิบัติที่ดีที่สุดของ Agile Methodology ที่ช่วยให้ Team นักพัฒนามุ่งเน้นไปที่ Requirement ทางธุรกิจ ความปลอดภัย และคุณภาพของ Code ในขณะที่การ Deploy เป็นแบบอัตโนมัติ, ระบบ CI สร้างวิธีการสร้าง, Package, และทดสอบ Code ที่สอดคล้องกันและเป็นอัตโนมัติ การรวมเข้าด้วยกันทำให้นักพัฒนาสามารถแก้ไขเปลี่ยนแปลง Code ได้บ่อยขึ้น

หลังจากที่ Code ถูก Commit แล้ว CD จะเข้ามาแทนที่และแจกจ่ายไปยัง Environment ต่างๆ เช่น Dev, Test, และ Production ผ่านระบบอัตโนมัติ

กระบวนการ CI/CD นั้นจัดเก็บ Parameter ที่เฉพาะกับ Environment ทั้งหมดที่จำเป็นบรรจุไปพร้อมกับการส่งมอบแต่ละครั้ง และทำการอัตโนมัติในการเรียก Web Server, ฐานข้อมูล, หรือ Server อื่นๆ ที่อาจจำเป็นต้อง Restart หลังจากที่ทำการติดตั้ง App แล้ว

Jenkins เป็นเครื่องมือสำหรับ CI/CD ที่ได้รับความนิยมมากที่สุด แต่ก็มีข้อจำกัดบางประการ อย่างไรก็ตาม การเรียนรู้และฝึกฝนการใช้งาน Jenkins ก็ยังคงมีประโยชน์ แม้ว่าในอนาคตคุณอาจจะเปลี่ยนไปใช้เครื่องมือ CI/CD ตัวอื่นๆ เช่น GitLab, Travis หรือ CircleCI

อาจมีชุดเครื่องมือรวมกันไม่จำกัดจำนวนเพื่อ Build, configure และ Deploy Code และ App ใน "DevOps stack"

พื้นฐานที่ดีหากคุณกำลังเริ่มต้นคือการผสมผสาน Tool ที่ได้รับความนิยมตลอดกาล:
  • Terraform (เพื่อสร้างโครงสร้างพื้นฐาน)
  • Ansible (เพื่อกำหนดค่า)
  • Jenkins (เพื่อ Deploy App)

ความเข้าใจที่มากขึ้นเกี่ยวกับ Template AWS และ CloudFormation ยังมีคุณค่าอย่างมากใน DevOps เช่นเดียวกับความเข้าใจเกี่ยวกับ Git, Docker, Kubernetes, Jira/Confluence, Nexus/Maven, Bash, JSON/YAML, PowerShell... และรายการอื่นๆ
:cool:
 
Last edited:

PlAwAnSaI

Administrator
  • A company is running an app on several Amazon EC2 instances in an Auto Scaling group behind an ALB. The load on the app varies throughout the day, and EC2 instances are scaled in an out on a regular basis. Log files from the EC2 instances are copied to a central Amazon S3 bucket every 15 mins. The security team discovers that log files are missing from some of the terminated EC2 instances.
    To ensure that log files are copied to the central S3 bucket from the terminated EC2 instances should Create an AWS Systems Manager document with a script to copy log files to Amazon S3. Create an Auto Scaling lifecycle hook and an Amazon EventBridge (Amazon CloudWatch Events) rule to detect lifecycle events from the Auto Scaling group. Invoke an AWS Lambda function on the autoscaling:EC2_INSTANCE_TERMINATING transition to call the AWS Systems Manager API SendCommand operation to run the document to copy the log files and send CONTINUE to the Auto Scaling group to terminate the instance.
    If the instance is terminating, both abandon and continue allow the instance to terminate. However, abandon stops any remaining actions, such as other lifecycle hooks, and continue allows any other lifecycle hooks to complete.

Storage Gateway Types:
Storage Gateway​
Key Features​
File GatewayAccesses S3 as NFS or SMB file shares.
Acts as a file interface between on-premises apps and AWS.
Volume GatewayPresents cloud-backed iSCSI block storage volumes to on-premises apps, managing data in Amazon S3. It facilitates low-latency access for frequently used data. Supports snapshots (stored as EBS snapshots), clones, and local caching.

In the cached mode, primary data resides in Amazon S3 with frequently accessed data cached locally for quick access.
In the stored mode, the primary dataset resides on-premises for low-latency access, while asynchronously backing up to Amazon S3.
Tape GatewayOffers a Virtual Tape Library (VTL) for backup and archival needs.
Stores virtual tapes in Amazon S3 / Glacier.

  • A company ingests and processes streaming market data. The data rate is constant. A nightly process that calculates aggregate statistics is run, and each execution takes about 4 hours to complete. The statistical analysis is not mission critical to the business, and previous data points are picked up on the next execution if a particular run fails.
    The current architecture uses a pool of Amazon EC2 Reserved Instances with 1-year reservations running full time to ingest and store the streaming data in attached Amazon EBS volumes. On-Demand EC2 instances are launched each night to perform the nightly processing, accessing the stored data from NFS shares on the ingestion servers, and terminating the nightly processing servers when complete. The Reserved Instance reservations are expiring, and the company needs to determine whether to purchase new reservations or implement a new design.
    The most cost-effective design is Updating the ingestion process to use Amazon Kinesis Data Firehose to save data to Amazon S3 will reduce the need for EC2 instances and EBS volumes for data storage.
    Using AWS Batch with Spot Instances to perform nightly processing will leverage the cost savings of Spot Instances, which are up to 90% cheaper than On-Demand Instances. It will also handle the scheduling and scaling of the processing jobs.
    Setting the maximum Spot price to 50% of the On-Demand price will reduce the chances of interruption and ensure that the processing is cost-effective.

AWS Security Services:
Security Service​
Features​
AWS Web Application Firewall (WAF)Protection against common web exploits (SQL Injection/XSS style attacks)
AWS ShieldProtection against DDoS attacks, Shield Standard (free), Shield Advanced (paid)
Amazon GuardDutyThreat detection, monitoring for malicious activity, integrates with CloudWatch and CloudTrail
Amazon InspectorAutomated security assessment, vulnerability scanning, compliance checks for EC2 instances
AWS KMSSecure encryption key management. Integrated with other AWS Services.
AWS Certificate ManagerProvision, manage, and deploy SSL/TLS certificates for AWS-based websites and applications.
Amazon MacieData security and discovery, sensitive data (PII) identification, automated data classification
Amazon DetectiveAnalysis and investigation of security findings and issues across AWS resources
AWS Security HubAggregates security findings & compliance status across AWS accounts - centralized monitoring
AWS CloudHSMHardware-based key storage and cryptographic operations for securing sensitive data.
Amazon CognitoAuthentication, authorization, and user management for web and mobile apps


  1. การใช้ count และ for_each ใน Terraform:
    Code:
    https://nopnithi.medium.com/examples-of-using-count-vs-for-each-in-terraform-e82db053b5f7
  2. ข้าม Terraform Apply หาก Plan แล้ว No Changes บน Azure Pipeline:
    Code:
    https://nopnithi.medium.com/ข้าม-terraform-apply-หาก-plan-แล้ว-no-changes-บน-azure-pipeline-34ad380fb217
  3. สรุป JSON และ YAML ที่ทุกคนควรรู้ (โดยเฉพาะสาย Cloud/DevOps):
    Code:
    https://nopnithi.medium.com/สรุป-json-และ-yaml-ที่ทุกคนควรรู้-โดยเฉพาะสาย-cloud-devops-66dc28a3a6a7
  4. เขียน Infrastructure Code เป็น Stack ย่อย ๆ (Modular) ดีกว่า:
    Code:
    https://nopnithi.medium.com/เขียน-infrastructure-code-เป็น-stack-ย่อย-ๆ-modular-ดีกว่า-3e050f3c0086
  5. ใช้ AWS Command (CLI) ทีเดียวหลาย Account:
    Code:
    https://nopnithi.medium.com/176f924dec73
  6. ใช้ Terraform ผ่าน Container ด้วย Docker Compose:
    Code:
    https://nopnithi.medium.com/6b47987787ff
  7. สร้าง AWS Resource ทีเดียวหลาย Account ด้วย CloudFormation:
    Code:
    https://nopnithi.medium.com/178344851cb4
  8. มือใหม่สนใจด้าน Cloud เริ่มจากเจ้าไหนดี?:
    Code:
    https://nopnithi.medium.com/298289d1ea40
    1712930316051

  9. เรียนคำสั่ง Linux เบื้องต้นสำหรับ Cloud และ DevOps:
    Code:
    https://nopnithi.medium.com/c1f51cd31a3b
  10. รวม 6 เรื่องเกี่ยวกับการสอบ Certification ด้าน Cloud:
    Code:
    https://nopnithi.medium.com/a64f8cb00ba4
  11. แก้ไข Terraform Code แต่ Apply ไม่ได้ อาจเพราะ DependencyViolationError:
    Code:
    https://nopnithi.medium.com/a09495d363aa
  12. Skill พื้นฐานสำหรับงานด้าน Cloud และ DevOps:
    Code:
    https://nopnithi.medium.com/487d1ca5034a
  13. การ Generate IAM Policy (Least Privilege) จากการใช้งานจริง:
    Code:
    https://nopnithi.medium.com/af4c09f43e3b
  14. ติดตั้ง CloudWatch Agent หลาย Account ด้วย CloudFormation และ SSM:
    Code:
    https://nopnithi.medium.com/97f25bd884b1
  15. การ Execute Command ใน Container บน Amazon ECS:
    Code:
    https://nopnithi.medium.com/d3fdf7e7cd78
  16. เรียน AWS IAM เบื้องต้นแบบสั้น ๆ พร้อม Lab:
    Code:
    https://nopnithi.medium.com/8eb3e25c3385
  17. Architecture Design บน AWS: ใช้กี่ Availability Zone (AZ) ดี?:
    Code:
    https://nopnithi.medium.com/ed509e4d829b
  18. Python Script สำหรับ Backup และ Restore EC2 Tag:
    Code:
    https://nopnithi.medium.com/d1bfb0805f9a
:cool:
 
Last edited:

PlAwAnSaI

Administrator
  • A company is currently in the design phase of an app that will need an RPO of less than 5 mins and an RTO of less than 10 mins. The solutions architecture team is forecasting that the DB will store approximately 10 TB of data. As part of the design, they are looking for a DB solution that will provide the company with the ability to fail over to a secondary Region.
    The best Solution will meet these business requirements at the LOWEST cost is to Deploy an Amazon RDS instance with a cross-Region read replica in a secondary Region. This will provide the company with a DB solution that can fail over the secondary Region in case of a disaster. The read replica will have minimal replication lag and can be promoted to become the primary in less than 10 mins, meeting the RTO requirement. The RPO can also be met by using synchronous replication within the primary Region and asynchronous replication across regions. This solution will also have the lowest cost, as it does not involve additional services or resources.

Network Connectivity Types:
Connectivity Type​
Key Features​
VPC PeeringPrivate connectivity between two VPCs, Communication using private IP addresses, non-transitive networking, Direct inter-VPC communication.
Transit GatewayCentralized hub for connecting multiple VPCs, VPNs & on-premises networks, Hub-and-spoke architecture, Scalable and efficient traffic routing. Simplified VPC connectivity
Direct ConnectDedicated, private network connection between on-premises and AWS, Consistent network performance, Low latency and high bandwidth, Secure data transfer.
Site-to-Site VPNEncrypted connection between on-premises network and AWS VPC, established over the internet, Secure communication using IPsec protocol, Remote access to resources.

  • A company runs a content management app on a single Windows Amazon EC2 instance in a dev environment. The app reads and writes static content to a 2 TB Amazon Elastic Block Store (EBS) volume that is attached to the instance as the root device. The company plans to deploy this app in production as a highly available and fault-tolerant solution that runs on at least three EC2 instances across multiple AZs.
    A solution architect must design a solution that joins all the instances that run the app to an Active Directory domain. The solution also must implement Windows ACLs to control access to file contents. The app always must maintain exactly the same content on all running instances at any given point in time.
    Solution will meet these requirements with the LEAST management overhead is Create an Amazon FSx for Windows File Server file system. Create an Auto Scaling group that extends across three AZs and maintains a minimum size of three instances. Implement a user data script to install the app and mount the FSx for Windows File Server file system. Perform a seamless domain join to join the instance to the AD domain.

VPC Endpoints:
Endpoints​
Key Features​
Gateway (VPC) EndpointSecure private connection to Amazon S3 or DynamoDB from within a VPC. Data does not go over public internet.
Interface (VPC) EndpointSecure private connection to many services powered by AWS PrivateLink
These include AWS services or hosted by AWS partners.
Data does not go over public internet.
AWS PrivateLink
Provides private connectivity between VPCs, supported AWS services, and on-premises networks without exposing traffic to the public internet.

  • A company is running multiple workloads in the AWS Cloud. The company has separate units for software development. The company uses AWS Organizations and federation with SAML to give permissions to dev to manage resources in their AWS accounts. The dev units each deploy their production workloads into a common production account.
    Recently, an incident occurred in the production account in which members of a dev unit terminated an EC2 instance that belonged to a different dev unit. A solutions architect must create a solution that prevents a similar incident from happening in the future. The solution also must allow dev the possibility to manage the instances used for their workloads.
    Strategy will meet these requirements is Pass an attribute for DevUnit as an AWS Security Token Service (STS) session tag (is key-value pairs that can define in Identity Provider (IdP) and pass in SAML assertion) during SAML federation. Update the IAM policy for the dev's assumed IAM role with a deny action and a StringNotEquals condition (can prevent dev from accessing or modifying EC2 instances that belong to a different dev unit) for the DevUnit resource tag and aws: PrincipalTag/DevUnit. This way can enforce fine-grained access control and prevent accidental or malicious incidents.

NAT Services:
NAT Service​
Key Features​
NAT InstanceUser-managed EC2 instance for NAT
Manual configuration required.
Potential single point of failure
Needs manual maintenance and updates.
Suitable for cost-conscious setups
NAT GatewayFully managed AWS service
Automated setup, no instance configuration needed.
Scalable, no single point of failure
Maintenance-free and auto-scaled
Ideal for high availability and critical production use
Code:
https://blog.cloudopian.com/blog/azure-devops-with-aws

Azure DevOps กับ AWS

นี่คือ Series บทช่วยสอนที่จะพูดถึงวิธีใช้ Azure DevOps เข้ากับบริการของ AWS, Azure DevOps (ก่อนหน้านี้รู้จักกันในชื่อ Team Foundation Server หรือเรียกสั้น ๆ ว่า TFS) อยู่มาเป็นเวลานานและมอบประสบการณ์ที่ดีให้กับนักพัฒนา, AWS เป็นผู้นำในระบบ Cloud การเข้าใจวิธีใช้ Azure DevOps กับ AWS ถือเป็นสิ่งสำคัญ ในบทช่วยสอนนี้ จะอธิบายเกี่ยวกับพื้นฐานให้รู้ก่อน จากนั้นเราจะให้ตัวอย่างการใช้ Azure DevOps กับบริการ AWS ต่างๆ นะคับ

บทช่วยสอนการเริ่มต้นอย่างรวดเร็วของ Azure DevOps สำหรับวิศวกร AWS DevOps

มีบางสถานการณ์ที่เราต้องการใช้ Azure DevOps กับ AWS ในสถานการณ์เหล่านั้น หากยังใหม่กับ Azure DevOps อาจรู้สึกงงกับ Feature ที่ Azure DevOps นำเสนอ ในบทช่วยสอนเริ่มต้นอย่างรวดเร็วนี้ เราจะแนะนำเกี่ยวกับแนวคิด โครงสร้าง และสิ่งที่จำเป็นของ Azure DevOps ที่ต้องการทราบก่อนที่จะนำ AWS มารวม


การ Integrate ส่วนใหญ่เกิดขึ้นใน Azure DevOps Repos และ Pipelines ใน Video จะได้เรียนรู้หัวข้อต่อไปนี้:

  • โครงสร้างโครงการ Azure DevOps และส่วนประกอบของ Hierarchy

  • Azure DevOps agent/agent pools

  • วิธีสร้าง Pipeline เพิ่มขั้นตอน Pipeline ให้กับ Pipeline แล้ว Execute:
    [Video timestamp: 0-18 นาที]: เราสร้าง Pipeline Azure DevOps อย่างง่ายภายใต้ Project BuildTest จากนั้นเราเพิ่มขั้นตอนการสร้างสองขั้นตอน ขั้นตอน Command Line หนึ่งขั้นตอนที่พิมพ์ข้อความ “hello” และ Script PowerShell ที่พิมพ์ข้อความ “สวัสดีจาก PowerShell 911” มายัง Console
    Your Azure DevOps organization > New project > Project name: BuildTest > Create > Repos > Files > Initialize
    Pipelines > New pipeline > Azure Repos Git > BuildTest > Starter pipeline > Show assistant > ... > Rename Pipeline > Edit > Validate > Run

  • วิธีเปิดใช้งานและปิดใช้งาน Azure DevOps Agent Pool:
    [Video timestamp: 18-21 นาที]: เราปิดใช้งาน Agent Pool และจัด Queue การดำเนินการ Pipeline ใหม่ สังเกตสิ่งที่เกิดขึ้น อย่าลืมเปิดใช้งาน Agent Pool อีกครั้ง
:cool:
 
Last edited:

PlAwAnSaI

Administrator
  • A solution architect is redesigning a three-tier app that a company hosts on premises. The app provides personalized recommendations based on user profiles. The company already has an AWS account and has configured a VPC to host the app.
    The frontend is a Java-based app that runs in on-premises VMs. The company hosts a personalization model on a physical app server and uses TensorFlow to implement the model. The personalization model uses Artificial Intelligence and Machine Learning (AI/ML). The company stores user information in a Microsoft SQL Server DB. The web app calls the personalization model, which reads the user profiles from the DB and provides recommendations.
    The company wants to migrate the redesigned app to AWS. Solution will meet this requirement with the LEAST operational overhead is Export the personalization model. Store the model artifacts in Amazon S3. Deploy the model to Amazon SageMaker and create an endpoint. Host the Java app in AWS Elastic Beanstalk. Use AWS Db Migration Service (DMS) to migrate the SQL Server DB to Amazon RDS for SQL Server.

    Amazon SageMaker is a fully managed ML service that allows users to build, train, and deploy ML models quickly and easily. Users can export their existing TensorFlow models and store the model artifacts in Amazon S3, a highly scalable and durable object storage service. Users can then deploy the model to it and create an endpoint that can be invoked by the web app to provide recommendations. This way, the solution can leverage the AI/ML capabilities of it without having to rewrite the personalization model.

    AWS Elastic Beanstalk is a service that allows users to deploy and manage web app without worrying about the infrastructure that runs those apps. Users can host their Java app in it and configure to communicate with the Amazon SageMaker endpoint. This way, the solution can reduce the operational overhead of managing servers, load balancers, scaling, and app health monitoring.

    AWS DMS is a service that helps users migrate DBs to AWS quickly and securely. Users can use it to migrate their SQL server DB to Amazon RDS for SQL Server, a fully managed relational DB service that offers high availability, scalability, security, and compatibility. This way, the solution can reduce the operational overhead of managing DB servers, backups, patches, and upgrades.

    AWS Server Migration Service (SMS) and AWS App MiGratioN Service (MGN) are services that helps users migrate on-prem workloads to AWS. However, it will not take advantage of the AI/ML capabilities or the managed services. It is not cost-effective or scalable.
    Code:
    https://www.doit.com/how-to-use-aws-application-migration-service-for-migrations

Migration Services:
Migration Service​
Key Features​
AWS Application Discovery ServiceCollects info on servers, running processes and network connections in on-prem environment using agents/collectors.
AWS Migration HubCentralized tracking of app migrations
AWS MGNMigrate Servers (Virtual, Cloud) / Apps - to AWS
From on-prem, other cloud providers.

Migrate EC2 workloads across regions, AZs or Accounts

Continuous synchronization
between the source and target environments during the migration (replication) process. EBS Volumes created during migration.

Lift and Shift / Re-hosting Migration strategy
Minimal (little or no) downtime- Live Replication
VM Import/ExportImport VM images from existing environment (VMware, Microsoft Hyper-V, or Citrix Xen) to Amazon EC2, and export them back to on-prem environment

No Live synchronization. Offline process
Create a repository of VM images for backup and disaster recovery

  • A company has AWS accounts that are in an organization in AWS Organizations. The company wants to track Amazon EC2 usage as a metric. The company's architecture team must receive a daily alert if the EC2 usage is more than 10% higher than the average EC2 usage from the last 30 days.
    Solution will meet these requirements is Configure AWS Cost Anomaly Detection in the organization's management account. Configure a monitor type of AWS Service. Apply a filter of Amazon EC2. Configure an alert subscription to notify the architecture team if the usage is 10% more than the average usage for the last 30 days.
    AWS Cost Anomaly Detection is a feature of the AWS Cost Management suite that leverages machine learning to enable continuous monitoring of AWS costs and usage, allowing to identify unexpected and abnormal spending. Can create cost monitors that evaluate specific AWS services, member accounts, cost allocation tags, or cost categories based on AWS account structure. Can also configure alert subscriptions that notify when a cost monitor detects an anomaly that meets threshold.
    Can create a cost monitor with a monitor type of AWS Service and apply a filter of Amazon EC2 to track the EC2 usage as a metric. Can then configure an alert subscription to notify the architecture team if the usage is 10% more than the average usage for the last 30 days.

Offline Data Transfer to AWS:
Snow Family of Devices​
Key Features​
SnowconePortable, rugged transfers.
Capacity: 8 TB / 14 TB SSD of data
Snowball Edge
[Storage or Compute Optimized]
Large-scale, transfers.
Capacity:
Storage Optimized: 80 TB HDD / 210 TB NVMe SSD
Compute Optimized: 42 TB HDD / 28 TB NVMe SSD
SnowmobileExabyte-scale data transfer in a truck
Capacity: 100 PB

  • Cloud Native นั้นยอดเยี่ยมมากสำหรับธุรกิจ Startup เพราะพวกเขาไม่ต้องซื้ออะไร สามารถไปที่ Cloud ได้เลย มันสามารถปรับขนาดได้มาก และมีความคล่องตัวมากกว่ามากในระบบ Cloud
    ใน Environment แบบดั้งเดิม ถ้าต้องการ Server ใหม่ก็ต้องติดต่อ Dell / IBM หรือ HP และเค้าก็สร้าง Server มาให้ และจัดส่ง กระบวนการทั้งหมดนี้อาจใช้เวลา 4 หรือ 6 สัปดาห์ หรือนานกว่านั้น ในกรณีที่อุปกรณ์ขาดแคลน จากนั้น Server ก็มาถึง ก็ต้องติดตั้ง Hypervisor, ต้องติดตั้ง App, ระบบปฏิบัติการ (OS) ซึ่งใช้เวลานานมาก ประมาณ 45 วันเลยทีเดียว แต่บน Cloud สามารถทำได้ภายในไม่กี่วินาที Cloud ให้ความคล่องตัวหรือความเร็วมากกว่าสิ่งอื่นใดที่มีอยู่และนั่นก็ยอดเยี่ยมอย่างยิ่งต่อธุรกิจทุกวันนี้ที่ปลาเร็วกินปลาใหญ่

  • Solution / Cloud Architect เป็นงานออกแบบ มันจะไม่มีการเขียนโปรแกรมเลย ไม่ใช่งาน Script แต่เป็นตำแหน่ง Business/วิศวกร จะไปพบปะกับลูกค้า 50% ของเวลาของคุณจะโต้ตอบกับผู้บริหาร ไม่ว่าจะเป็น CEP, CFO, CTO, CIO, VP, หรือ Director ถามคำถามธุรกิจ, กฎหมาย, Requirement ทาง Technique และทำการวิเคราะห์ Environment ของลูกค้า ถามคำถามเพิ่มเติม จากนั้นจึงออกแบบ Solution นำเสนอกลับไปยังลูกค้า ทั้งในรูปแบบการนำเสนอและเอกสาร Architecture ที่สวยงาม เมื่อลูกค้ายินยอม Cloud Architect จะส่งมอบให้กับ >

  • Cloud Engineer เพื่อสร้างมันขึ้นมา Cloud Engineer จะสร้างสิ่งที่ Cloud Architect ออกแบบไว้ และหลังจากที่สร้างมันขึ้นมาแล้ว จะส่งมันให้กับ >

  • Team SysOps เพื่อดูแลรักษามัน
Azure DevOps Zero to Hero | Full course for beginners:
Code:
https://www.youtube.com/playlist?list=PLl4APkPHzsUXseJO1a03CtfRDzr2hivbD
Code:
https://awstip.com/azure-devops-ci-cd-with-terraform-943ed2630ce6
Code:
https://medium.com/@mr.mornesnyman/aws-ecs-service-deployment-azure-devops-pipelines-terragrunt-and-manifest-file-30419eef0434
Code:
https://medium.com/nerd-for-tech/terraform-modules-101-create-version-and-publish-on-github-4455f3673559
:cool:
 
Last edited:

PlAwAnSaI

Administrator
  • A company uses AWS Organizations AWS account. A solution architect must design a solution in which only administrator roles are allowed to use IAM actions. However, the solution architect does not have access to all the AWS account throughout the company.
    To restrict IAM actions to only administrator roles across all AWS accounts in an organization, the most operationally efficient solution is to Create a Service Control Policy (SCP) that allow IAM actions only/exclusively for administrator roles and Apply this SCP to the root Organization Unit (OU) of AWS Organizations. This method ensures a centralized governance mechanism that uniformly applies the policy across all accounts, thereby minimizing the need for individual account-level configurations and reducing operational complexity.
    AWS Organizations and SCPs offers comprehensive information on creating and managing SCPs for organizational-wide policy enforcement. This approach aligns with AWS best practices for managing permissions and ensuring secure and compliant account configurations within AWS Organization.​

Analytics Services:
Analytics Service​
Key Features​
Amazon RedshiftPetabyte-scale data warehousing, Columnar storage, Automatic performance optimization, Integration with various BI tools
Redshift Spectrum QueryRun SQL queries from Redshift directly against data stored in Amazon S3 (without loading the data into Redshift)
Amazon AthenaServerless query service, Query data in S3 using SQL, Pay-per-query pricing, no infrastructure to manage
Amazon EMRManaged Hadoop framework, Apache Spark, HBase, Presto support, Scalable, resizable clusters, Integration with other AWS services
AWS GlueExtract, Transform, Load (ETL) service, Glue Data Catalog - Data cataloging and metadata management, Serverless, fully managed, Integration with various data stores
Amazon QuickSightBusiness Intelligence & Reporting tool, Interactive dashboards, ML-powered insights, Integration with various data sources

  • A company is hosting a critical app on a single Amazon EC2 instance. The app uses an Amazon ElastiCache for Redis single-node cluster for an in-memory data store. The app uses an Amazon RDS for MariaDB DB instance for a relational DB. For the app to function, each piece of the infrastructure must be healthy and must be in an active state.
    A solution architect needs to improve the app's architecture so that the infrastructure can automatically recover from failure with the least possible downtime. To meet these requirements should:
    • Use an Elastic Load Balancer and an Auto Scaling group (ASG) with a minimum capacity of two instances can improve the availability and scalability of the EC2 instances that host the app. The load balancer can distribute traffic across multiple instances and the Auto Scaling group can replace any unhealthy instances automatically.
    • Modify the DB instance to create a multi-AZ deployment that extends across two AZs can improve the availability and durability of the RDS for MariaDB DB. Multi-AZ deployments provide enhanced data protection and minimize downtime by automatically failing over to a standby replica in another AZ in case of a planned or unplanned outage.
    • Create a replication group for the ElastiCache for Redis cluster and enable multi-AZ on the cluster can improve the availability and fault tolerance of the in-memory data store. A replication group consists of a primary node and up to five read-only replica nodes that are synchronized with the primary node using asynchronous replication. Multi-AZ allows automatic failover to one of the replicas if the primary node fails or becomes unreachable.

Kinesis Services:
Amazon Kinesis Service​
Key Features​
Data StreamsIngest data streams (at scale) for processing.
Data FirehoseCapture, transform & load data streams into data stores like S3, Redshift, OpenSearch, etc.
Data Analytics
(Amazon Managed Service for Apache Flink)
Real-time analytics on streaming data
Video StreamsSecurely stream video from devices to AWS for Analytics, ML, storage, etc.


STAR Method:

  • S - Situation - Within our DevOps workflow, implementing the CI/CD process for each new project required a manual approach, posing challenges in terms of efficiency and consistency. Despite this, we remained committed to delivering high-quality solutions that met the unique needs of each project.

  • T - Task - As a DevOps engineer, I embraced the challenge of manually implementing the CI/CD process for new projects. My task was to ensure that our CI/CD pipeline was configured accurately, tailored to each project's requirements, and delivered with a focus on customer obsession, ownership, and frugality.

  • A - Action:
    • Customer Obsession: I approached each new project implementation with a customer-centric mindset, understanding that project teams were the primary stakeholders. I collaborated closely with project teams to understand their requirements, preferences, and timelines, ensuring that the CI/CD pipeline aligned with their needs and facilitated their development process effectively.
    • Ownership: Taking ownership of the manual implementation process, I ensured that each CI/CD pipeline configuration was meticulously tailored to meet the specific needs of the project. I took full responsibility for the accuracy and reliability of the pipeline, striving for excellence in every aspect of the implementation.
    • Frugality: Recognizing the importance of optimizing resources, I focused on minimizing waste and maximizing efficiency in the manual implementation process. While manual configuration required time and effort, I remained mindful of resource utilization, avoiding unnecessary complexity and ensuring that each step contributed to the overall value delivered to the organization.
    • Documentation and knowledge sharing: To promote consistency and efficiency in manual implementation, I documented the steps involved in configuring the CI/CD pipeline for new projects. This documentation served as a reference for future projects and was shared with the team to facilitate knowledge sharing and onboarding.
      .
  • R - Result - Our DevOps team successfully navigated the challenges posed by the manual approach. We delivered CI/CD pipelines that were accurately configured, tailored to each project's requirements, and aligned with our commitment to customer obsession, ownership, and frugality. Despite the constraints of manual implementation, our dedication to these principles enabled us to deliver high-quality solutions efficiently and effectively, driving positive outcomes for our organization and our customers.

Kubernetes คืออะไร ทำไม Orchestration จึงเป็นหัวใจของ Infrastructure ยุคนี้:
Code:
https://www.blognone.com/node/106492
Code:
https://www.nops.io/blog/aws-eks-vs-ecs-the-ultimate-guide
Code:
https://www.reddit.com/r/devops/comments/13qtujx/on_aws_why_use_eks_instead_of_ecs
:cool:
 
Last edited:

PlAwAnSaI

Administrator
  • A solutions architect is designing an app to accept timesheet entries from employees on their mobile devices. Timesheets will be submitted weekly, with most of the submissions occurring on Friday. The data must be stored in a format that allows payroll administrators to run monthly reports. The infrastructure must be highly available and scale to match the rate of incoming data and reporting requests.
    Steps meets these requirements while minimizing operational overhead are:​
    • Deploy the app front end to an Amazon S3 bucket served by Amazon CloudFront. Deploy the app backend using Amazon API Gateway with an AWS Lambda proxy integration.​
    • Store the timesheet submission data in Amazon S3. Use Amazon Athena and Amazon QuickSight to generate the reports using Amazon S3 as the data source.​

EC2 Instance Launch Types:
Launch Type​
Key Features​
On-DemandFlexible, immediate access without long-term commitment.
ReservedSignificant cost savings for committed usage over 1 or 3 years.
SpotLower costs with bidding-based pricing for unused capacity.
Can get terminated anytime.
Dedicated HostPhysical servers dedicated solely for use. Per host billing.
Control over EC2 Instance placement. Can be useful for regulatory needs.
Dedicated InstancesInstances on hardware dedicated. Per instance billing.
No control over instance placement.
  • A company needs to optimize the cost of an AWS environment that contains multiple accounts in an organization in AWS Organizaions. The company conducted cost optimization activities 3 years ago and purchased Amazon EC2 Standard Reserved Instances that recently expired.
    The company needs EC2 instances for 3 more years. Additionally, the company has deployed a new serverless workload.
    Strategy will provide the company with the MOST cost saving is purchase the same Reserved Instances for an additional 3-year term with All Upfront payment. The company should purchase a 3-year Compute Savings Plan with All Upfront payment in the management accout to cover any additional compute costs.

    ris_and_savings_plans-1024x553.png
    https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F61833d2c-4a14-4f48-9bd1-69a9003aab41_1024x768.png
AWS 'Organization' Services:
Service​
Key Features​
AWS OrganizationsManage and govern multiple accounts centrally in a hierarchy.
AWS Control TowerAutomated setup for multi-account environments, predefined security policies, and centralized account management within AWS Organizations.
AWS SCPsCentralized control over IAM actions, enforcement of organizational policies, and high-level restrictions on AWS service access.
AWS Service CatalogCurated catalog for approved AWS services, customizable provisioning templates, and controlled access to predefined products.
  • A research company is running daily simulations in the AWS Cloud to meet high demand. The simulations run on several hundred Amazon EC2 instances that are based on Amazon Linux 2. Occasionally, a simulation gets stuck and requires a cloud operation engineer to solve the problem by connecting to an EC2 instance through SSH. Company policy states that no EC2 instance can use the same SSH key and that all connections must be logged in AWS CloudTrail.
    Can meet these requirements by Launch new EC2 instance without setting up any SSH key for the instances. Set up EC2 Instance Connect on each instance. Create a new IAM policy, and attach it to the engineers' IAM role with an Allow statement for the SendSSHPublicKey action. Instruct the engineers to connect to the instance by using a browser-based SSH client from the EC2 console.​
Code:
https://blog.brainboard.co/aws-landing-zone-mastering-the-architecture-best-practices-and-design-secrets-a37746f72962
สถาปัตยกรรมการจัดตั้ง AWS Landing Zone: คู่มือครอบคลุมถึงแนวปฏิบัติที่ดีที่สุดและความลับในการออกแบบ:

หัวข้อนี้จะเจาะลึกเข้าไปใน AWS Landing Zone, การออกแบบ Environment ที่มีความปลอดภัย, AWS แบบหลาย Account โดยมีประเด็นสำคัญ เช่น การจัดการ Account ในที่เดียว, การตั้งค่า Landing Zone แบบอัตโนมัติ, การรักษาการกำกับดูแลองค์กร (Governance) ที่ดี คู่มือนี้จะอธิบายแนวปฏิบัติที่ดีที่สุดจาก AWS รวมถึงองค์ประกอบหลัก เช่น AWS Organizations, Control Tower และอื่นๆ มุ่งเน้นให้ Environment AWS มีประสิทธิภาพสูงสุดและมีความปลอดภัย
  1. องค์ประกอบหลักของสถาปัตยกรรม AWS Landing Zone
  2. องค์ประกอบเสริมที่ควรพิจารณา
  3. ประเด็นที่ต้องพิจารณาในการออกแบบ
  4. บทสรุป
  5. คำถามที่พบบ่อย
องค์ประกอบที่สำคัญของ AWS Landing Zone ซึ่งเป็นสถาปัตยกรรมมาตรฐานสำหรับการจัดการ Environment AWS อย่างมีประสิทธิภาพ รวมถึงแนวปฏิบัติที่ดีที่สุด (Best Practices):

AWS Organizations เป็นบริการที่ช่วยให้สามารถสร้างและจัดการ Account AWS หลายๆ Account ได้ในที่เดียว และปรับใช้นโยบายทั่วทั้งองค์กร
หนึ่งใน Best Practice สำหรับการตั้งค่าและใช้งาน AWS Organizations ใน AWS Landing Zone คือ การนำมาใช้สร้าง Environment แบบมีหลาย Account ซึ่งจะช่วยแยกการจัดเก็บข้อมูลและการประมวลผล ส่งผลให้มีความปลอดภัยและสอดคล้องกับข้อกำหนดต่างๆ มากขึ้น
อีกแนวปฏิบัติที่ดีคือ การใช้ AWS Organizations สร้าง Account ผู้ชำระเงิน (Payer Account) เชื่อมต่อกับ Account อื่นๆ ทำให้สามารถจัดการและตรวจสอบค่าใช้จ่ายของ Account ที่ Link กันได้ในที่เดียว

การ Execute Command ใน Container บน Amazon ECS:
  1. สร้าง VPC endpoint: VPC > Endpoints > Create endpoint >
    Name tag: ตั้งชื่อ endpoint (ssm-message)
    Services: com.amazonaws.<region>.ssmmessages
    กด create endpoint (ล่างขวา)

    ฝั่ง Client:
  2. Code:
    https://dev.classmethod.jp/articles/what-is-aws-cli-how-to-use-aws-cli-for-beginners
  3. Code:
    https://docs.aws.amazon.com/systems-manager/latest/userguide/install-plugin-windows.html
  4. Code:
    https://medium.com/i-gear-geek/จัดการข้อมูล-json-ไม่ใช่เรื่องยากด้วย-jq-9f8f6427a0fd

  5. Set AWS profile ให้สามารถเชื่อมต่อกับ Account ของเราได้
    C:\Users\plawansai> aws configure
  6. C:\Users\plawansai> aws ecs execute-command --cluster <clustername> --task <task id> [-- container <containername>] --command <shell> --interactive

ตัวอย่าง IAM Policy สำหรับ Access S3:
JSON:
{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Sid": "AllowS3",
            "Effect": "Allow",
            "Action": "s3:*",
            "Resource": [
                "arn:aws:s3:::s3-thaicpe-nonprd-randomstring/*",
                "arn:aws:s3:::s3-thaicpe-nonprd-randomstring"
            ]
        }
    ]
}

Code:
ttps://medium.com/quintuples/รวม-docker-command-line-พื้นฐาน-74b61101effa

รวม Docker Command Line พื้นฐาน สำหรับ AWS Engineer:

  • aws ecr get-login-password --region <ap-southeast-1> | docker login --username AWS --password-stdin <registry-id/Account_ID>.dkr.ecr.<ap-southeast-1>.amazonaws.com
    อันดับแรกต้อง Login ไปยัง Docker Registry ก่อน
:cool:
 
Last edited:

PlAwAnSaI

Administrator
Code:
https://explore.skillbuilder.aws/learn/course/11458/play/42651/play-cloud-quest-cloud-practitioner

AWS:

AWS Global Infrastructure Overview:

AWS Global Infrastructure Benefits:

AWS Well-Architected:

AWS Well-Architected Overview:

Amazon S3:

Amazon S3 Overview:

Amazon S3 More Features:

Amazon S3 - Access Management: https://www.youtube.com/watch?v=2Ayvr-BOYmY
  1. There is no limit of the maximum number of objects that an Amazon S3 bucket can store.

  2. The S3 bucket owner can create a bucket policy to grant public access to a bucket when configuring it for website hosting.

  3. Amazon S3 Lifecycle configuration automatically changes data storage tiers based on user specifications.

  4. The AWS Management Console is not recommended for uploading files larger than 160 GB to Amazon S3.

  5. Type of deployment models are used in cloud computing are Cloud, Hybrid, and On premises.

  6. Amazon S3 bucket policy sizes have a 20 KB limit.

  7. A dev would like to set up a simple, low-cost, static website that delivers HTML, JavaScript, images, video, and other files to visitors. The dev should Create an Amazon S3 bucket, and then enable static website hosting.

  8. A cloud computing model are Infrastructure, Platform, and Software as a Service (IaaS, PaaS, SaaS).

  9. Amazon S3 bucket policies and IAM policies written in JSON format.

  10. Amazon S3 bucket is A container for objects stored in Amazon S3 (every object is contained in a bucket).

  11. Amazon S3 provides object storage and is built to store and retrieve any amount of data from anywhere on the Internet.

  12. The data consistency model Amazon S3 provides strong read-after-write consistency for PUT and DELETE operations in all AWS Regions.

  13. Server > Amazon EC2, DB > Amazon RDS, Storage > Amazon S3.
Amazon EC2:

Amazon EC2 Overview: https://www.youtube.com/watch?v=03WCGv8vItw

Amazon EC2 Storage Networking: https://www.youtube.com/watch?v=gQKe-MV3Krw

Amazon EBS Overview: https://www.youtube.com/watch?v=lmfbKdQ6PKQ

Amazon EBS Features: https://www.youtube.com/watch?v=QpTigpgpMIM

Amazon EBS Benefits: https://www.youtube.com/watch?v=AnBvZNQxcQo

Amazon EBS Volume Types: https://www.youtube.com/watch?v=ideyAMUJNr0
  1. Volumes in Amazon EBS are automatically replicated within an AZ.

  2. The default view for the AWS Management Console displays resources in the Region that is currently selected in the console.

  3. An AWS Region is Multiple, isolated, and physically separate AZs within a geographic area.

  4. Tags key-value pair can be used to describe an Amazon EC2 instance through custom content and metadata.

  5. When creating an AMI can be included Installed software, Operating system, and EBS snapshots.

  6. Cloud computing is an IT resources are delivered over the internet, on demand, with pay-as-you-go pricing.

  7. Amazon EC2 provides resizable compute capacity in the cloud, designed to help devs with web-scale computing.

  8. Security groups acts as a virtual firewall that controls the traffic for one or more instances.

  9. Three AZs, at least, make up an AWS Region.

  10. When launching an Amazon EC2 instance in an AWS Region can be select AZ.

  11. A security group was configured with a rule to allow HTTPS traffic to an instance. If an HTTP connection is attempted, unless there is a rule explicitly allowing HTTP, the security group will deny the connection.

  12. Volumes in Amazon EBS are automatically replicated within an AZ.
AWS Systems Manager:

AWS - Systems Manager Overview: https://www.youtube.com/watch?v=e7RUdj2-CDs
  1. EC2 Instance Connect can help users connect to an instance with Linux/SSH.

  2. When the number of EC2 instances is increased behind a load balancer, it is used Horizontal scaling.

  3. Can be changed an Amazon EC2 instance Type to the demands of a workload.

  4. Amazon EC2 provide Compute capacity in the cloud that is secure and resizable.

  5. EC2 Instance Connect no need a user-created and downloaded SSH key.

  6. m5.large is an example of an Amazon EC2 instance type.

  7. Can be configured Instance type, Security group, etc. when creating a new Amazon EC2 instance.

  8. Can connect a user to an Amazon EC2 Linux instance through an SSH client by Public IP address.

  9. An Amazon EBS backed EC2 instance must be in a Stopped state to change its instance type.
Cloud Economics:

AWS Pricing Overview: https://www.youtube.com/watch?v=cl5aWahLlpw

  1. There is no charge for inbound data from the internet into AWS.

  2. AWS Pricing Calculator use AWS Price List API to create estimates.

  3. When an instance is stopped, charges for the instance stop but any attached Amazon EBS storage continues to be billed.

  4. AWS Savings Plans pricing model offers lower prices on compute and machine learning across any AWS Region.

  5. A customer has two m5.xlarge Amazon EC2 instances, each with 40 GB of storage attached. One instance is running while the other is stopped. The customer will be charged for the one running instance and for 80 GB of storage.

  6. Windows and Linux Amazon EC2 instances have Free Tier eligible instance types.

  7. Amazon Data Lifecycle Manager automates the creation, retention, and deletion of Amazon EBS snapshots and AMIs backed by Amazon EBS.

  8. Amazon EC2 Spot Instances adjusts based on supply and demand of EC2 instances.

  9. Savings Plans > Amazon EC2, Intelligent-Tiering > Amazon S3, Amazon Data Lifecycle Manager > Amazon EBS.
Amazon VPC:

Amazon VPC Overview: https://www.youtube.com/watch?v=haYW7Qb9Q4g

Amazon VPC - Internet Connectivity: https://www.youtube.com/watch?v=nyqUgLuijFM

Amazon VPC Concepts: https://www.youtube.com/watch?v=MKsLqTBmgCM

Amazon VPC Security: https://www.youtube.com/watch?v=NPIkGE8tEDw

  • A company is designing an app that will requires cross-Region disaster recovery with an RTO of less than 5 mins and an RPO of less than 1 min. The app tier DR solution has already been designed and a Solution Architect must design the data recovery solution for the MySQL DB tier.
    To meet the data recovery requirements the DB should Use an Amazon Aurora global DB with the primary in the active Region and the secondary in the failover Region.
    Amazon Aurora Global DB is designed for globally distributed apps, allowing a single Amazon Aurora DB to span multiple AWS regions. It replicates data with no impact on DB performance, enables fast local reads with low latency in each region, and provides disaster recovery from region-wide outages.

    2021-02-23_00-27-54-041d5f65382c91fe2014aebcefc2084c.JPG
    • A read replica cannot be used as a writable DB. It is possible to promote a read replica, but this may not be fast.
    • Cannot configure a MySQL DB on EC2 to be a standby for an Amazon RDS DB instance.
    • Amazon RDS multi-AZ deployments cannot span across AWS Regions, it is within region.
:cool:
 
Last edited:

PlAwAnSaI

Administrator
Code:
https://rsvp.withgoogle.com/events/chaiyogcp-s4
  1. Generative AI Explorer - Vertex AI
  2. Baseline: Infrastructure
  3. Monitor and Manage Google Cloud Resources
  4. Google Cloud Computing Foundations: Infrastructure in Google Cloud - Locales
  5. Gemini for Data Scientists and Analysts
  6. Manage Kubernetes in Google Cloud
  7. Build Infrastructure with Terraform on Google Cloud
  8. Google Cloud Computing Foundations: Networking & Security in Google Cloud
  9. Google Cloud Computing Foundations: Data, ML, and AI in Google Cloud
  10. Introduction to AI and Machine Learning on Google Cloud
  11. Intro to ML: Language Processing
  12. Create and Manage AlloyDB Instances
  13. Create and Manage Cloud SQL for PostgreSQL Instances
  14. Analyze Speech and Language with Google APIs
  • Every bucket must have a unique name across the entire Cloud Storage namespace.

  • Object names must be unique only within a given bucket.

  • Each bucket has a default storage class, which you can specify when you create your bucket.

  • An access control list (ACL) is a mechanism you can use to define who has access to your buckets and objects.

  • Can stop publicly sharing an object by removing the permission entry that has allUsers.

  • Cloud Functions is a serverless execution environment for event driven services on Google Cloud.

  • A publisher application creates and sends messages to a topic. Subscriber applications create a subscription to a topic to receive messages from it.

  • Cloud Pub/Sub is an asynchronous messaging service designed to be highly reliable and scalable.
Where do I store this stuff?:
  1. Storage options in the cloud:

  2. Structured and unstructured data storage:

  3. Unstructured storage using Cloud Storage:

  4. Lab Intro: Cloud Storage: Qwik Start - CLI/SDK:



    • Instance ID is used to uniquely identify your instance within the project.
      .




  5. Archive storage is for an unstructured storage solution for archiving files that might never be accessed again.
    .
    • Google Cloud offers two managed relational database services: Cloud Spanner and Cloud SQL.

    • Bigtable storage solution is a petabyte scale, NoSQL database.
      .
There's an API for that!:






  1. Apigee Edge is a platform for developing and managing API proxies has a specific focus on business problems, like rate limiting, quotas, and analytics.
    .
    • API stand for Application Programming Interface.

    • Cloud Endpoints API management system supports applications running in App Engine, Google Kubernetes Engine, and Compute Engine.
      .
You can't secure the cloud, right?:







  1. When a customer moves an application to Google Cloud, the customer remain responsible for Data security.
    .
    • Client-side encryption is a customer encrypt data before sending it to Google Cloud.

    • Will find intrusion detection on The operational security level of Google Cloud’s infrastructure security.

    • Basic IAM role is the most broad in scope.
      .
  • Terraform enables to safely and predictably create, change, and improve infrastructure.
It helps to network:











  1. Point of presence (PoP) is where the Google network connected to the rest of the internet.
    .
    • Dedicated Interconnect provides a direct connection to Google.

    • If required cross-regional load balancing for a web application should use HTTP(S) Load Balancing.

    • Routing table is used to forward traffic from one instance to another within the same network, across subnetworks, or even between Google Cloud zones, and doesn’t require an external IP address.
      .
:cool:
 
Last edited:

PlAwAnSaI

Administrator
Keeping an eye on things:
  1. Introduction to Infrastructure as Code (IaC):

  2. Terraform:

  3. Monitoring and managing services, applications, and infrastructure:

  4. Google Cloud's operations suite:


  5. Can store and version-control your Terraform templates on Cloud Source Repositories.
    .
    • Cloud Monitoring ingests metrics, events, and metadata to generate insights through dashboards, Metrics Explorer charts, and automated alerts.

    • In Cloud Logging, the default log retention period for data access logs is 30 days.
      .
You have the data, but what are you doing with it?:



    • Clusters can be created and scaled quickly with a variety of virtual machine types, disk sizes, and number of nodes.
      .

    • Google Cloud Dataflow supports batch processing.
      .



  1. Can use three basic patterns to load data into BigQuery. Generated data involves using SQL statements to insert rows into an existing table or to write the results of a query to a table.
    • BigQuery provides built-in machine learning features, offers a flexible pay-as-you-go pricing model, and both data storage and analytics.
    • Dataproc is a managed Spark and Hadoop service that lets you benefit from open source data tools for batch processing, querying, streaming, and machine learning.
      .
Let machines do the work:









  1. AutoML is a no-code solution that lets you build your own machine learning models on Vertex AI through a point-and-click interface.
    .
    • Google machine learning Speech-to-Text API can be used to convert audio to text for data processing.
      .

AI Foundations:






  • Google Cloud Storage could store unstructured data, like images, text, and/or audio.

  • AI should avoid creating or reinforcing unfair bias.

  • Vertex AI, AutoML, and Generative AI Studio align to Machine learning stage of the data-to-AI workflow.

  • Should use Unsupervised learning, cluster analysis of machine learning to discover the underlying pattern and group a collection of unlabeled photos into different sets.

  • CREATE MODEL SQL command would use to create an ML model in BigQuery ML.

  • Tensor Processing Units (TPUs) is Google hardware innovation tailors' architecture to meet the computation needs on a domain, such as the matrix multiplication in machine learning.

  • AI foundations, AI development, and AI solutions are the three layers of the AI/ML framework on Google Cloud.
AI Development Options:





  • A video production company wants to use machine learning to categorize event footage but does not want to train its own ML model. Pre-trained APIs can help get started.

  • Company has a massive amount of data and want to train own machine learning model to see what insights ML can provide. Due to resource constraints, they require a codeless solution. AutoML can help.

  • Custom training code-based solution offered with Vertex AI gives data scientists full control over the development environment and process.

  • tf.keras is a high-level TensorFlow library that has been commonly used to build ML models. tf.keras.Sequential lets create a neural network with multiple layers.

  • A global hotel chain that has recently loaded some guest data into BigQuery. You have experience writing SQL and want to leverage machine learning to help predict guest trends for the next few months. BigQuery ML can help.
AI Development Workflow:






  • Machine learning workflow > Data preparation, model development, model serving.
    .
    • Data preparation stage of the machine learning workflow includes data upload and feature engineering.

    • Model development includes model training and evaluation.
:cool:
 
Last edited:

PlAwAnSaI

Administrator
  • A hospital uses the machine learning technology of Google to help pre-diagnose cancer by feeding historical patient medical data to the model. The goal is to identify as many potential cases as possible. Recall metric should the model focus on.

  • A farm uses the machine learning technology of Google to detect defective apples in their crop, like those with irregular sizes or scratches. The goal is to identify only the apples that are actually bad so that no good apples are wasted. Precision metric should the model focus on.

  • When build an ML pipeline on Vertex AI to automate the ML workflow, can include both prebuilt components (by Google) and custom components into the pipeline.
Generative AI:
  1. Generative AI and workflow:

  2. Gemini multimodal:

  3. Prompt design:

  4. Model tuning:



  • Few-shot prompt is a type of prompt that allows a large language model to perform a task with only a small number of examples.

  • Generative AI Studio is A tool that lets you quickly test and customize generative AI models so you can leverage their capabilities in your applications.

  • Set the temperature to a high value is the best way to generate more creative or unexpected content by adjusting the model parameters in Generative AI Studio.

  • Run a call center that handles customer questions from multiple channels, such as email, phone calls, and chat. You want to improve customer satisfaction and agent efficiency by using AI to automate routine requests, help agents with complex tasks and discover insights. Should choose Contact Center AI solution on Google Cloud.

  • AI solutions provided by Google Cloud are Vertical solutions, which focus on specific industries, and horizontal solutions, which solve problems across industries.
  • A model version is an instance of a machine learning solution stored in the Vertex AI model service.

  • Vertex AI offers training jobs and batch prediction jobs.

  • A serverless app is using AWS Lambda and Amazon DynamoDB and dev have finalized an update to the Lambda function code. AWS CodeDeploy will be used to deploy new versions of the function. Updates to the Lambda function should be delivered to a subset of users before deploying the changes to all users. The update process should also be easy to abort and rollback if necessary. The solution architect should use A canary deployment CodeDeploy configuration.
    When using AWS CodeDeploy with AWS Lambda there are four ways traffic can be shifted during a deployment:
    • Canary: Traffic is shifted in two increments. Can choose from predefined canary options that specify the percentage of traffic shifted to updated Amazon ECS task set / Lambda function in the first increment and the interval, in minutes, before the remaining traffic is shifted in the second increment.
    • Linear: Traffic is shifted in equal increments with an equal number of minutes between each increment. Can choose from predefined linear options that specify the percentage of traffic shifted in each increment and the number of minutes between each increment (multiple increments).
    • All-at-once: All traffic is shifted from the original Lambda function to the updated Lambda function all at once, does not deploy to a subset of users first.
    • Blue/green: Traffic is shifted from one version of a Lambda function to a new version of the same Lambda function.
      All AWS Lambda and deployments are blue/green, as a new version of the function is created, and traffic is shifted using one of the available options. Canary is the best choice if just want to shift a percentage of traffic across to a subset of users and then shift the remainder.
      .
  • A company has deployed a High-Performance Computing (HPC) cluster in an Amazon VPC. The cluster runs a tightly coupled workload that generates a large number of shared files that are stored in an Amazon EFS file system. The cluster has grown to over 800 instances and the performance has degraded to a problematic level.
    With HPC clusters with tightly coupled workloads require inter-node communication that is high-performance and low latency. Elastic Fabric Adapter (EFA) is a network interface for Amazon EC2 instances that enables customers to run apps requiring high levels of inter-node communications at scale on AWS.
    In addition to using EFAs with supported EC2 instances, AWS recommend that launch instances into a single AZ to ensure the latency between nodes is low.
    Another cause of latency in the design could be the EFS file system. Amazon FSx for Lustre is a fully managed service that provides cost-effective, high-performance, scalable storage for compute workloads. FSx for Lustre offers sub-millisecond latencies, up to hundreds of gigabytes / second of throughput, and millions of IOPS.
    Replacing EFS with Lustre will reduce the latency for storage operations.
  1. A company needs to architect a hybrid DNS solution. This solution will use an Amazon Route 53 private hosted zone for the domain cloud.example.com for the resources stored within VPCs.
    The company has the following DNS resolution requirements:
    • On-premises systems should be able to resolve and connect to cloud.example.com.
    • All VPCs should be able to resolve cloud.example.com.
    • There is already an AWS Direct Connect connection between the on-premises corporate network and AWS Transit Gateway.
      To meet these requirements with the HIGHEST performance, the company should Associate the private hosted zone to all the VPCs. Create a Route 53 inbound resolver in the shared services VPC. Attach all VPCs to the transit gateway and create forwarding rules in the on-premises DNS server for cloud.example.com that point to the inbound resolver.
      .
  2. A company is providing weather data over a REST-based API to several customers. The API is hosted by Amazon API Gateway and is integrated with different AWS Lambda functions for each API operation. The company uses Amazon Route 53 for DNS and has created a resource record of weather.example.com. The company stores data for the API in Amazon DynamoDB tables. The company needs a solution that will give the API the ability to fail over to a different AWS Region.
    Solution will meet these requirements is Deploy a new API Gateway API and Lambda functions in another Region. Change the Route 53 DNS record to a failover record. Enable target health monitoring. Convert the DynamoDB tables to global tables.
:cool:
 
Last edited:
Top