System Design: Quy trình 4 bước thiết kế hệ thống

Trong bài viết này, chúng tôi sẽ hướng dẫn bạn quy trình 4 bước để thiết kế hệ thống (System Design) và cung cấp một số thông tin để bạn thực hiện các ước tính cho hệ thống.

Bước 1: Phác thảo các trường hợp sử dụng, ràng buộc và giả định

Thu thập các yêu cầu và xác định phạm vi vấn đề. Đặt câu hỏi để làm rõ các trường hợp sử dụng và các ràng buộc. Thảo luận về các giả định.

  • Ai sẽ sử dụng nó?
  • Họ sẽ sử dụng nó như thế nào?
  • Có bao nhiêu người dùng?
  • Hệ thống làm gì?
  • Đầu vào và đầu ra của hệ thống là gì?
  • Chúng ta dự kiến ​​xử lý bao nhiêu dữ liệu?
  • Chúng ta mong đợi bao nhiêu yêu cầu mỗi giây?
  • Tỷ lệ đọc ghi dữ liệu dự kiến ​​là bao nhiêu?

Bước 2: Tạo thiết kế cấp cao

Phác thảo một thiết kế cấp cao với tất cả các thành phần quan trọng.

  • Phác thảo các thành phần chính và kết nối
  • Căn chỉnh cho các ý tưởng của bạn

Bước 3: Thiết kế các thành phần cốt lõi

Đi sâu vào chi tiết cho từng thành phần cốt lõi. Ví dụ: nếu bạn thiết kế một dịch vụ rút ngắn URL, hãy thảo luận:

1 - Tạo và lưu trữ băm của url đầy đủ.

  • MD5 và Base62
  • Hàm băm
  • SQL hoặc NoSQL
  • Lược đồ cơ sở dữ liệu

2 - Chuyển đổi một url được băm sang url đầy đủ

  • Tra cứu cơ sở dữ liệu.

3 - API và thiết kế hướng đối tượng

Bước 4: Mở rộng thiết kế

Xác định và giải quyết các nút thắt, các hạn chế. Ví dụ: bạn có cần những thứ sau để giải quyết các vấn đề về khả năng mở rộng không?

  • Cân bằng tải (load balancer)
  • Mở rộng theo chiều ngang (horizontal scaling)
  • Bộ nhớ đệm (caching)
  • Sharding cơ sở dữ liệu (database sharding)

Nghiên cứu về các giải pháp tiềm năng và sự đánh đổi. Mọi thứ đều là sự đánh đổi. Giải quyết tắc nghẽn bằng cách sử dụng các nguyên tắc thiết kế hệ thống có thể mở rộng.

Tính toán mặt sau của phong bì

Tính toán mặt sau của phong bì (Back-of-the-envelope calculations) là bạn sẽ thực hiện một số ước tính cho hệ thống. Bạn có thể sử dụng các thông tin dưới đây để thực hiện một số ước tính này bằng tay:

Lũy thừa của hai

Một lũy thừa của hai là một số có dạng 2 n trong đó n là số nguyên.

Power           Exact Value         Approx Value        Bytes
---------------------------------------------------------------
7                             128
8                             256
10                           1024   1 thousand           1 KB
16                         65,536                       64 KB
20                      1,048,576   1 million            1 MB
30                  1,073,741,824   1 billion            1 GB
32                  4,294,967,296                        4 GB
40              1,099,511,627,776   1 trillion           1 TB

Các con số về độ trễ mà mọi lập trình viên nên biết

Latency Comparison Numbers
--------------------------
L1 cache reference                           0.5 ns
Branch mispredict                            5   ns
L2 cache reference                           7   ns                      14x L1 cache
Mutex lock/unlock                           25   ns
Main memory reference                      100   ns                      20x L2 cache, 200x L1 cache
Compress 1K bytes with Zippy            10,000   ns       10 us
Send 1 KB bytes over 1 Gbps network     10,000   ns       10 us
Read 4 KB randomly from SSD*           150,000   ns      150 us          ~1GB/sec SSD
Read 1 MB sequentially from memory     250,000   ns      250 us
Round trip within same datacenter      500,000   ns      500 us
Read 1 MB sequentially from SSD*     1,000,000   ns    1,000 us    1 ms  ~1GB/sec SSD, 4X memory
HDD seek                            10,000,000   ns   10,000 us   10 ms  20x datacenter roundtrip
Read 1 MB sequentially from 1 Gbps  10,000,000   ns   10,000 us   10 ms  40x memory, 10X SSD
Read 1 MB sequentially from HDD     30,000,000   ns   30,000 us   30 ms 120x memory, 30X SSD
Send packet CA->Netherlands->CA    150,000,000   ns  150,000 us  150 ms

Notes
-----
1 ns = 10^-9 seconds
1 us = 10^-6 seconds = 1,000 ns
1 ms = 10^-3 seconds = 1,000 us = 1,000,000 ns

Các chỉ số tiện dụng dựa trên các con số ở trên:

  • Đọc tuần tự từ HDD với tốc độ 30 MB/s
  • Đọc tuần tự từ Ethernet 1 Gbps với tốc độ 100 MB/s
  • Đọc tuần tự từ SSD với tốc độ 1 GB/s
  • Đọc tuần tự từ bộ nhớ chính với tốc độ 4 GB/s

Bảng các con số về độ trễ

Bảng các con số về độ trễ
System DesignSoftware Architecture
Bài Viết Liên Quan:
System Design: Bắt đầu từ đâu
Trung Nguyen 09/01/2021
System Design: Bắt đầu từ đâu

Trong bài viết này, chúng ta sẽ đi qua các bước để giải quyết từng vấn đề thiết kế. Hướng dẫn này có thể giúp bạn thiết kế một hệ thống.

System Design: Phỏng vấn về thiết kế hệ thống
Trung Nguyen 03/01/2021
System Design: Phỏng vấn về thiết kế hệ thống

Trong bài viết này, chúng ta sẽ tìm hiểu cách chuẩn bị để vượt qua những câu hỏi khi phỏng vấn về thiết kế hệ thống phần mềm (system design).