Thành phố, khách sạn, điểm đến04-05 Oct, 2 Khách, 1 đêm
Tìm kiếm
Ngày đến Fri, Oct 04
1
Ngày vềSat, Oct 05
Số phòng, số khách1 phòng, 2 người lớn, 0 trẻ em

Biểu đồ Semi-Log là gì và Làm thế nào Bạn Có Thể Sử Dụng Nó cho Dữ liệu Covid?

Bởi: Minprice.com
26/03/20240like

Dường như rất rõ rằng mọi thứ không diễn ra tốt trong đại dịch Covid-19 này. Tình hình xấu đi và có vẻ đang trở nên tồi tệ hơn. Số người nhiễm bệnh đang trở nên vô cùng lớn. Hiện nay, đã có hơn 10 triệu trường hợp Covid-19 được xác nhận chỉ ở Hoa Kỳ. Nhưng một số quốc gia khác (như Hàn Quốc) có số ca ít hơn đáng kể—dưới 30,000. Hoặc có thể bạn muốn xem xét số ca ốm ở Hoa Kỳ vào tháng Ba, khi chúng chỉ đếm bằng trăm, và so sánh với tháng Mười, khi chúng đếm bằng triệu. Vậy làm thế nào để hiển thị dữ liệu cho những điều có sự chênh lệch lớn về giá trị như vậy? Câu trả lời là sử dụng biểu đồ semi-log. Tôi sẽ giải thích cụ thể cách nó hoạt động.

Hãy bắt đầu với một biểu đồ đơn giản về số ca nhiễm được xác nhận theo số ngày. Trong ví dụ này, Ngày 1 là ngày đầu tiên mà Hoa Kỳ (và Hàn Quốc) có trường hợp Covid dương tính đầu tiên của họ. Vì Hàn Quốc có dân số nhỏ hơn Hoa Kỳ (51 triệu so với 328 triệu), có thể hữu ích nếu bạn muốn bao gồm một số quốc gia lớn khác. Tôi sẽ sử dụng Brazil (209 triệu) và Ấn Độ (1.4 tỷ). Đây chỉ là một biểu đồ bình thường (không semi-log) cho bốn quốc gia này. Ồ, bạn có thể lấy tất cả dữ liệu này từ Kho Dữ liệu Covid-19 tại Đại học Johns Hopkins.

Bạn nhận thấy điều gì từ biểu đồ này? Ngoại trừ việc Hoa Kỳ đang thực sự không tốt với số ca nhiễm của mình? Điều bạn nên chú ý là bạn thậm chí không thể nhìn thấy dữ liệu cho Hàn Quốc. Nó ở đó, chỉ là quá nhỏ để nhìn thấy. Nếu bạn muốn xem xét cả dữ liệu lớn của Hoa Kỳ và dữ liệu không-quá-lớn của Hàn Quốc, bạn cần một biểu đồ semi-log. (Trong trường hợp này, "log" viết tắt cho logarithm—không phải là một cái gốc gỗ thực sự.)

Không xác định

Thế này là gì vậy? Một biểu đồ semi-log là gì? Tôi đoán điều đầu tiên cần giải thích là logarithm. Hãy bắt đầu với một con số—một con số lớn. Sao nếu chúng ta bắt đầu với 1 triệu? Tôi có thể viết số này theo cách phổ biến nhất là 1 theo sau bởi 6 số không. Như thế này: 1,000,000. Nhưng tôi cũng có thể viết nó dưới dạng lũy thừa của mười.

Chỉ để rõ ràng, 106 có nghĩa là 10 x 10 x 10 x 10 x 10 x 10. Nhưng nếu tôi muốn thực hiện nghịch đảo của 10 lên một số mũ nào đó? Việc viết số lớn bằng cách đưa chúng lên một số mũ là điều dễ dàng hơn—điều này chính xác là chúng ta làm với các số trong biểu đồ khoa học. Việc tìm số mũ của 10 mà một số nâng lên chính xác là những gì logarithm làm. Nếu tôi lấy logarit của 1,000,000, kết quả sẽ là 6. Oh, đây là một lưu ý quan trọng. Nếu chúng ta nói về 10 mũ một số nào đó, điều đó có nghĩa là chúng ta đang sử dụng một logarithm cơ số 10. Hai cơ sở phổ biến nhất là 10 (vì chúng ta viết số theo cơ sở 10) hoặc e, số tự nhiên với e xấp xỉ 2.718 (nó là số vô tỷ). Đây là một giải thích chi tiết hơn về e.

Nhưng đợi chút! Bạn cũng có thể lấy logarithm cho những số không phải là lũy thừa số mũ nguyên của 10. Hãy chọn một số nào đó—tôi sẽ chọn 1,234. Nếu tôi lấy logarithm của số này, kết quả sẽ là:

Điều này có nghĩa là nếu bạn đưa 10 lên mũ 3.09132, bạn sẽ được 1,234. Nhưng tại sao? Tại sao bạn lại làm như vậy? OK, hãy quay lại với dữ liệu Covid tồi tệ của chúng ta. Giả sử thay vì vẽ biểu đồ về số lượng nhiễm trùng được xác nhận, tôi vẽ log (cơ sở 10) của số lượng nhiễm trùng. Sau đó, tôi có thể vẽ biểu đồ của log số lượng so với số ngày. Đây là cái nhìn về điều đó.

Chỉ để rõ ràng—đây là cùng một dữ liệu như biểu đồ đầu tiên, nhưng có một sự khác biệt lớn. Bạn thực sự có thể nhìn thấy dữ liệu cho Hàn Quốc ngay cả khi số liệu của quốc gia này thấp hơn nhiều so với số liệu ở Hoa Kỳ. Tại sao? Chúng ta hãy xem tổng số ca nhiễm trùng được xác nhận tính đến ngày 17 tháng 11 năm 2020. Đối với Hoa Kỳ, đó là 11,036,935 và đối với Hàn Quốc, đó là 28,769. Bây giờ hãy lấy log (cơ sở 10) của cả hai con số này.

Trừ khi bạn muốn một ước lượng rất xấp xỉ về hàm log, bạn sẽ cần chỉ đơn giản nhập điều này vào máy tính của bạn (hoặc sử dụng một bảng log khi bạn tra cứu giá trị). Bây giờ thay vì có các số có khoảng cách rất xa nhau, chúng ta bây giờ có các giá trị trong cùng một phạm vi (7.04 và 4.46) sao cho chúng sẽ dễ dàng vừa trong cùng một tỷ lệ trên biểu đồ. Nhưng bạn không cần phải thực sự lấy log của dữ liệu. Còn một lựa chọn khác—sử dụng một trục dọc phi tuyến. Đây là cái nhìn về điều đó.

Chú ý rằng các số trên trục đứng không có kích thước bước cố định. Các đánh dấu trên trục đứng chỉ hiển thị sự tăng lên bởi một lũy thừa của 10 thay vì sự tăng thêm một lượng cố định, chẳng hạn như thêm 1,000 trường hợp nhiễm. Vì thang đo ngang vẫn là tuyến tính, điều này được gọi là biểu đồ semi-log. Một biểu đồ log-log sẽ có cả hai trục đều ở mức tự nhiên số mũ.

Khi nào bạn nên sử dụng biểu đồ semi-log và khi nào bạn nên sử dụng biểu đồ trục tuyến tính? Nếu dữ liệu của bạn bao gồm một phạm vi rất rộng các giá trị (khác nhau về cấp độ) thì bạn hầu như phải tạo một biểu đồ semi-log để bạn có thể nhìn thấy tất cả. Nếu phạm vi dữ liệu ở cùng một cấp độ (thậm chí nếu nó là các số rất lớn) thì bạn có thể chỉ cần tạo một biểu đồ bình thường. Nhưng bạn cần phải cẩn thận. Nếu bạn nhìn vào một biểu đồ semi-log và giả định nó có một trục tuyến tính, nó khiến Hàn Quốc trông như là khá tồi tệ khi thực sự không phải như vậy.

Thật đáng tiếc, đối với các trường hợp nhiễm Covid đã xác nhận, bạn hầu như cần một biểu đồ semi-log.


Nhiều thông tin tuyệt vời từ MINPRICE
  • 📩 Muốn nhận thông tin mới nhất về công nghệ, khoa học, và nhiều hơn nữa? Đăng ký nhận bản tin của chúng tôi!
  • Chết chóc, tình yêu, và niềm an ủi từ triệu chiếc xe máy
  • Kẻ lừa đảo muốn cứu vớt đất nước của mình
  • Far Cry 5 giúp tôi thoát khỏi cuộc sống thực tế, cho đến khi không thể nữa
  • Việc viết một bản tin về Covid đã chỉ cho tôi thấy về nước Mỹ
  • Để cứu mạng sống, đại dịch này phải được nhìn nhận
  • 🎮 MINPRICE Games: Nhận những mẹo mới nhất, đánh giá, và nhiều hơn nữa
  • ✨ Tối ưu hóa cuộc sống tại nhà với bộ sưu tập hàng đầu của đội ngũ Gear chúng tôi, từ robot hút bụi đến đệm giá rẻ đến loa thông minh