visitor

Thứ Ba, 21 tháng 2, 2012

Chiều cao và thành tựu của tổng thống Mĩ



Viết xong cái entry về chiều cao và tổng thống Mĩ tôi chợt thấy một bài báo thú vị có tên là “Is Presential Greatness Related to Height?” của Paul Sommers, giáo sư kinh tế của trường Middlebury College (bang Vertmont). Bài đăng trên tập san The Colege Mathematical Journal năm 2002, số 33, trang 14-16.
Ông giáo sư này làm thống kê chiều cao của tổng thống Mĩ trước. Sau đó ông tìm những đánh giá của giới sử gia Mĩ về thành tựu của họ trong thời gian tại chức. Thành tựu ở đây là chính sách kinh tế, giáo dục, y tế, khả năng ứng biến trong tình hình chiến tranh và khủng hoảng. Có bốn bậc thành tựu: great (lớn), near great (gần lớn), above average (trên trung bình), average (trung bình), below average (dưới trung bình), và failure (thất bại). Có một số tổng thống mà người ta không đánh giá được và kí hiệu là “na” (not available hay not applicable). Số liệu đó được trình bày trong bảng dưới đây.
Câu hỏi ông đặt ra là: có mối tương quan nào giữa chiều cao và thành tựu hay không? Cách đơn giản nhất để kiểm định giả thuyết này là tính chiều cao trung bình cho từng bậc. Tôi tính thử thì thấy như sau:
Thành tựu
Số tổng thống
Chiều cao trung bình và độ lệch chuẩn
Great
4
188 (0.5)
Near Great
4
179 (4.2)
Above Average
9
179 (9.2)
Average
11
177 (7.7)
Below Average
7
179 (4.2)
Failure
5
180 (4.7)
Như vậy, chiều cao xem ra có tương quan với mức độ thành tựu. Chiều cao càng cao thành tựu càng lớn. Nếu chúng ta chia thành tựu thành 3 nhóm: Great và Near Great thành một nhóm, average và above average thành một nhóm, và below average và failure, thì kết quả sẽ là:
Thành tựu
Số tổng thống
Chiều cao trung bình và độ lệch chuẩn
Great + Near Great
8
184 (5.4)
Average + Above Average
20
178 (8.2)
Failure + Below Average
12
179 (4.2)
Rõ ràng có sự khác biệt về chiều cao và sự thành tựu của tổng thống. Nhưng thú vị hơn có lẽ là lời giải thích và lí thuyết đằng sau nó. Tôi thấy lí thuyết Darwin khá thuyết phục ở đây, nhưng tôi sẽ … không nói. :-)
Dựa vào kết quả quá khứ, có thể nói xác suất Obama trở thành một tổng thống “Great” hay “Near Great” có thể cao đấy. Cao bao nhiêu thì tôi để cho các bạn tính (vẫn mô hình logistic thôi). :-)
Còn George W. Bush? Dựa vào mô hình trên (chiều cao của GWB là 180 cm), tôi tính thấy xác suất ông ấy đắc cử là 50%. Còn xác suất làm tổng thống "great" hay "near great" thì exp(a+b*height) / (1+exp(a+b*height)), trong đó a=-26.573, b=0.1383) thì xác suất Bush làm tổng thống bậc đó chỉ 15%, ngay cả xác suất ông ấy trên trung bình (với a=-12.1322 và b=0.0651) cũng chỉ 37%.
Mua vui cũng được một vài phút giây. (Xin lỗi Tiên Điền tiên sinh tôi đã sửa lời của cụ!)
NVT
Danh sách tổng thống, chiều cao (cm) và thành tựu
Tên
Chiều cao
Thành tựu
Abraham Lincoln
188
great
Andrew Jackson
185
near great
Andrew Johnson
178
failure
Barack Obama
187
na
Benjamin Harrison
168
average
Bill Clinton
189
above ave
Calvin Coolidge
178
below ave
Chester A Arthur
188
average
Dwight D Eisenhower
179
above ave
Franklin D Roosevelt
188
great
Franklin Pierce
178
below ave
George H W Bush
188
average
George W Bush
180
below ave
George Washington
188
great
Gerald Ford
183
average
Grover Cleveland
180
above ave
Harry S Truman
175
near great
Herbert Hoover
180
average
James Buchanan
183
failure
James Garfield
183
na
James Madison
163
above ave
James Monroe
183
above ave
James Polk
173
above ave
Jimmy Carter
175
average
John Adams
170
average
John F Kennedy
183
above ave
John Quincy Adams
170
above ave
John Tyler
183
below ave
Lyndon B Johnson
192
above ave
Martin Van Buren
168
average
Millard Fillmore
175
below ave
Richard Nixon
182
failure
Ronald Reagan
185
below ave
Rutherford B Hayes
174
average
Theodore Roosevelt
178
near great
Thomas Jefferson
189
great
Ulysses S Grant
172
failure
Warren Harding
183
failure
William Henry Harrison
173
na
William Howard Taft
183
average
William McKinley
170
average
Woodrow Wilson
180
near great
Zachary Taylor
173
below ave

Số liệu tranh cử từ 1789 đến nay là ở đây. Bạn đọc nào có R trong computer, chỉ cần cắt và dán mấy lệnh dưới đây sẽ có kết quả như trong entry trước mà tôi đề cập đến:
year = c(2008, 2008, 2004, 2004, 2000, 2000, 1996, 1996, 1992, 1992,
1988, 1988, 1984, 1984, 1980, 1980, 1976, 1976, 1972, 1972,
1968, 1968, 1964, 1964, 1960, 1960, 1956, 1956, 1952, 1952,
1948, 1948, 1944, 1944, 1940, 1940, 1936, 1936, 1932, 1932,
1928, 1928, 1924, 1924, 1920, 1920, 1916, 1916, 1912, 1912,
1908, 1908, 1904, 1904, 1900, 1900, 1896, 1896, 1892, 1892,
1888, 1888, 1880, 1880, 1864, 1864, 1852, 1852, 1844, 1844,
1840, 1840, 1836, 1836, 1832, 1832, 1828, 1828, 1824, 1824,
1820, 1820, 1816, 1816, 1812, 1812, 1800, 1800, 1796, 1796,
1792, 1792, 1789, 1789)
height = c(187, 167, 180, 193, 180, 184, 189, 183,
189, 188, 188, 167, 185, 180, 185, 175, 175,
185, 182, 185, 182, 180, 192, 183, 183, 182,
179, 178, 179, 178, 175, 173, 188, 173, 188,
185, 188, 173, 188, 180, 182, 168, 178, 183,
183, 168, 180, 180, 180, 178, 182, 183, 178,
183, 170, 183, 170, 183, 180, 168, 168, 180,
183, 188, 192, 168, 178, 196, 173, 185, 173,
168, 168, 173, 185, 185, 185, 170, 170, 185,
183, 170, 183, 178, 163, 191, 189, 168, 170,
189, 188, 170, 188, 170)
won = c(1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,
1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1,
0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,
1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1,
0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,
1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1,
0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,
1, 0, 1, 0)
# kiem tra so lieu
cbind(year, height, won)
# Ve bieu do box
boxplot(height ~ won,
ylab="Chieu cao", xlab="Ket qua (1=thang, 0=thua")
# mo hinh hoi qui logistic
logist = glm(won ~ height, family=binomial)

Không có nhận xét nào:

Đăng nhận xét