Làm thế nào một âm mưu bong bóng tiết lộ các thành phố tốt nhất để sống ở Mỹ

Trong bài viết này, tôi sẽ cho bạn thấy một số sự thật thú vị về các thành phố của Mỹ, giá trị của các mảnh bong bóng trong việc quyết định thành phố nào sẽ sống và cách tạo ra các mảnh đất đó.

Bạn đang nghĩ về việc đầu tư vào bất động sản năm 2018? Di chuyển tới một thành phố mới? Khi xem xét các quyết định này, bạn cần cân nhắc các yếu tố khác nhau như tỷ lệ thất nghiệp, giá nhà đất, quy mô của thành phố, an toàn, v.v. Ngay cả với tất cả dữ liệu đó và bốn biểu đồ thanh tương ứng, bạn vẫn sẽ không nhìn chằm chằm vào bảng đó. Bạn có thể cố gắng tìm những ứng cử viên tốt nhất, nhưng những yếu tố đó đang kể những câu chuyện khác nhau Âm thanh giống như một vấn đề phức tạp.

Vì vậy, có cách nào chúng ta có thể hình dung tất cả các yếu tố này trong 1 biểu đồ và so sánh chúng TẤT CẢ? Vâng, chúng ta có thể sử dụng một âm mưu bong bóng!

Những gì một cốt truyện bong bóng?

Biểu đồ bong bóng là một loại biểu đồ hiển thị nhiều hơn hai chiều dữ liệu (so với các biểu đồ phân tán truyền thống). Ngoài việc vẽ một chấm trên mặt phẳng X-Y, nó sử dụng kích thước, màu sắc hoặc hình dạng của điểm để hiển thị nhiều kích thước hơn.

Chúng tôi sử dụng tỷ lệ thất nghiệp là trục X, giá nhà trung bình là trục Y và dân số của các thành phố là kích thước của các chấm. Điều này làm cho một chiều thứ ba tốt. Màu sắc được phân ngẫu nhiên cho mỗi thành phố.

Thành phố tốt nhất ở Mỹ để sinh sống là Sọ (chờ nó)

Người chiến thắng: Nashville!

Các khuyến nghị khác: Austin, Omaha, Milwaukee, Dallas, Minneapolis, Denver và Aurora.

Họ có tỷ lệ thất nghiệp thấp (và do đó có cơ hội tìm việc cao hơn) và giá nhà thấp, bởi vì họ ở phía dưới bên trái của lô đất. Điều đó nghĩa là gì?

Nó có nghĩa là bạn có thể đưa ra lựa chọn của mình dựa trên cốt truyện này.

Ví dụ: nếu bạn coi tỷ lệ thất nghiệp là quan trọng hơn và đừng để ý giá nhà cao hơn, thì Honolulu, Oakland, Boston và San Diego là những ứng cử viên nặng ký

Điều gì về việc thêm an toàn như là một yếu tố khác?

Chắc chắn rồi. Hãy để thêm sự an toàn như một yếu tố thứ tư (ba yếu tố còn lại vẫn là giá nhà, tỷ lệ thất nghiệp và dân số). Thay vì chỉ định ngẫu nhiên một màu cho một thành phố, chúng tôi sử dụng thang màu cho tội phạm (tỷ lệ tội phạm trên 100.000 người). Màu đỏ có nghĩa là tội phạm nhiều hơn và màu xanh có nghĩa là ít hơn.

Liệu kết quả có thay đổi?

Nó đã làm! Nếu sự an toàn là rất quan trọng đối với bạn, thì Milwaukee có thể không phải là một lựa chọn tuyệt vời trong số các khuyến nghị trước đó (ngay cả khi nó ở phía dưới bên trái của biểu đồ).

Bây giờ bạn thấy sức mạnh của âm mưu bong bóng: khả năng thể hiện nhiều yếu tố trong một âm mưu 2 chiều. Nếu bạn chỉ có các biểu đồ thanh cho các yếu tố đó, thì bạn khó có thể xác định các thành phố có sự kết hợp lý tưởng của các yếu tố. Cốt truyện bong bóng về cơ bản đã tạo ra một chức năng mục tiêu trực quan của người dùng để bạn tối ưu hóa một vấn đề ra quyết định đa biến.

Làm thế nào để tỷ lệ thất nghiệp và giá nhà thay đổi theo thời gian?

Chúng tôi có thể tạo biểu đồ chuyển động tương tác để thêm thời gian dưới dạng thứ nguyên (2013 đến 2017) để xem các yếu tố thay đổi như thế nào đối với các thành phố này theo thời gian.

Để tránh quá nhiều thông tin trực quan, tôi đã sử dụng dữ liệu tội phạm và sử dụng các màu khác nhau để đại diện cho một vài thành phố được chọn.

Tin tốt là tỷ lệ thất nghiệp ở hầu hết các thành phố đều giảm đáng kể (chuyển từ phải sang trái). Nhưng tin xấu là giá nhà đất đang tăng khá nhanh (đặc biệt là ở San Francisco, San Jose, Los Angles, New York và Seattle).

Bạn muốn tự tạo các biểu đồ? Đây là mã của tôi cho các ô bong bóng và biểu đồ chuyển động trong R. Hãy vui vẻ chơi với các ô :)

###############
# Lô bong bóng #
###############
thư viện (data.table)
thư viện (ggplot2)
thư viện (ggrepel)
bubble_data <-fread ("https://raw.githubusercontent.com/zhendata/Medium_Posts/c007346db1575aca391a6623c87bb5a31a60b365/bubble_plot_merged_city_data.csv"
bubble_plot <- ggplot (bubble_data,
               aes (x = Thất nghiệp_Rate, y = Home_Price / 1000)) +
geom_point (aes (size = Dân số, điền = Total_Crime), hình dạng = 21) +
# Tạo 'Bong bóng' bằng cách chỉ định kích thước một biến #
scale_fill_continupt (low = "# 33FFFF", high = "# FF6699") +
scale_size_area (max_size = 20) +
# Chọn thang màu bong bóng và kích thước tối đa của bong bóng #
geom lòng numpel (
          aes (nhãn = Thành phố), nudge_x = 0, nudge_y = 0,75, kích thước = 6) +
# Sử dụng geom lòng numpel để đẩy các nhãn ra khỏi nhau #
theme_bw () +
# Sử dụng nền trắng thay vì màu xám mặc định #
ggtitle ("Thành phố tốt nhất ở Hoa Kỳ để sống") + phòng thí nghiệm (x = "Tỷ lệ thất nghiệp%", y = "Giá nhà",
       size = "Dân số", fill = "Tội phạm") + chủ đề (lô.title = phần tử (size = 25, hjust = 0,5),
        angle.title = Element bản (size = 20, face = "bold"),
        ax.text = Element bản (kích thước = 15)) +
# Tiêu đề kiểu và trục #
scale_y_continupt (name = "Giá nhà", break = seq (0, 1500, by = 250),
                      nhãn = c ("0", "250K", "500K", "750K", "1000k", "1250k", "1500K"))
# Làm cho trục y dễ đọc hơn bằng cách thay thế số khoa học bằng "K" #
in (bubble_plot)
################
# Biểu đồ chuyển động #
################
thư viện (data.table)
thư viện (googleVis)
chuyển động
Motion_chart <- gvisMotionChart (motion_data,
idvar = "Thành phố",
timevar = "Năm",
xvar = "Tỷ lệ thất nghiệp",
yvar = "Giá nhà",
sizevar = "Dân số")
cốt truyện (motion_chart)
# R tự động mở một tab trong trình duyệt cho bạn
# Trình phát flash cần được bật trong trình duyệt
Nhấp vào biểu tượng của “⌽ để bật Flash
########
# Dữ liệu #
########
"" "
Các bộ dữ liệu tôi đã sử dụng là từ Zvel (nhà ở trung bình), chương trình UCR FBI, c điều tra về dân số (dân số), Cục Lao động (thất nghiệp).
Tôi đã làm sạch dữ liệu và tham gia định dạng tôi cần trong bài viết này và bạn có thể nhấp vào các liên kết bên dưới để tải xuống.
"" "
bubble_plot_merged_city_data.csv, motion_chart_merged_city_data.csv

Theo tôi và cho tôi một vài tiếng vỗ tay nếu bạn thấy điều này hữu ích!

Bạn cũng có thể đọc các bài viết trước của tôi về khoa học dữ liệu, bất động sản và ra quyết định: