Tính trung bình, trung vị, yếu vị, phương sai, độ lệch chuẩn
Phân tích dữ liệu của bạn trong 3 bước đơn giản:
Máy tính thống kê rất cần thiết trong nhiều lĩnh vực:
Phân tích dữ liệu thực nghiệm và kết quả khảo sát. Tính trung bình, trung vị, yếu vị để hiểu phân phối dữ liệu. Sử dụng độ lệch chuẩn để đánh giá sự biến thiên của dữ liệu. Tứ phân vị và IQR giúp xác định các giá trị ngoại lai. Cần thiết cho kiểm định giả thuyết và đánh giá ý nghĩa thống kê.
Phân tích dữ liệu bán hàng hàng tháng để xác định xu hướng. Tính doanh số trung bình (mean) và doanh số điển hình (median). Tìm sản phẩm bán chạy nhất (mode). Sử dụng độ lệch chuẩn để đánh giá biến động doanh số. Tứ phân vị giúp phân khúc khách hàng theo số tiền mua hàng.
Theo dõi kích thước và trọng lượng sản phẩm. Tính trung bình để kiểm tra xem sản xuất có đáp ứng thông số kỹ thuật không. Sử dụng độ lệch chuẩn để đánh giá sự ổn định của quy trình. Các sản phẩm nằm ngoài khoảng Q1-Q3 có thể cần kiểm tra. Phương sai thấp cho thấy chất lượng nhất quán.
Phân tích điểm thi của lớp. Tính điểm trung bình và trung vị để hiểu hiệu suất của lớp. Tìm yếu vị để xác định điểm số phổ biến nhất. Độ lệch chuẩn cho thấy sự biến thiên của điểm số. Tứ phân vị giúp xếp loại theo đường cong.
Phân tích các dấu hiệu sinh tồn của bệnh nhân (huyết áp, nhịp tim, v.v.). Tính trung bình để xác định phạm vi bình thường. Sử dụng độ lệch chuẩn để phát hiện các giá trị bất thường. Tứ phân vị giúp phân loại mức độ rủi ro. Cần thiết cho các nghiên cứu sức khỏe dân số.
Phân tích biến động giá cổ phiếu và lợi nhuận. Tính lợi nhuận trung bình (mean) và lợi nhuận điển hình (median). Sử dụng độ lệch chuẩn như một thước đo rủi ro đầu tư (biến động). SD cao hơn có nghĩa là rủi ro cao hơn. Tứ phân vị giúp xác định các biến động giá cực đoan.
Phân tích các chỉ số hiệu suất của vận động viên (thời gian, điểm số, khoảng cách). Tính hiệu suất trung bình (mean) và hiệu suất nhất quán (median). Sử dụng độ lệch chuẩn để đánh giá tính nhất quán. SD thấp cho thấy hiệu suất đáng tin cậy. Tứ phân vị giúp xác định các vận động viên hàng đầu.
Thống kê cơ bản là các thước đo số học tóm tắt và mô tả các tập dữ liệu. Chúng giúp hiểu được sự phân bố, xu hướng trung tâm và sự biến thiên của dữ liệu.
Các thống kê này cho biết "trung tâm" của dữ liệu:
Tổng của tất cả các giá trị chia cho số lượng. Công thức: Trung bình = Σx/n. Ví dụ: [10, 20, 30] → (10+20+30)/3 = 20. Nhạy cảm với các giá trị ngoại lai.
Giá trị ở giữa khi dữ liệu được sắp xếp. Đối với số lượng lẻ, đó là giá trị ở giữa. Đối với số lượng chẵn, là trung bình của hai giá trị ở giữa. Ví dụ: [10, 20, 30, 40, 50] → 30. Không bị ảnh hưởng bởi các giá trị ngoại lai.
Giá trị xuất hiện thường xuyên nhất. Ví dụ: [10, 20, 20, 30] → 20. Có thể có nhiều yếu vị hoặc không có yếu vị.
Các thống kê này cho biết dữ liệu "trải rộng" như thế nào:
Sự khác biệt giữa giá trị tối đa và tối thiểu. Công thức: Khoảng = Max - Min. Ví dụ: [10, 20, 30] → 30-10 = 20. Đơn giản nhưng nhạy cảm với các giá trị ngoại lai.
Trung bình của bình phương các độ lệch so với trung bình. Phương sai mẫu: s² = Σ(x-mean)²/(n-1). Phương sai quần thể sử dụng /n. Đo lường sự lan rộng tổng thể.
Căn bậc hai của phương sai. Cùng đơn vị với dữ liệu gốc. Công thức: SD = √Phương sai. Khoảng 68% dữ liệu nằm trong ±1 SD so với trung bình trong phân phối chuẩn. Thước đo độ trải rộng được sử dụng rộng rãi.
Sự khác biệt giữa Q3 và Q1. Công thức: IQR = Q3 - Q1. Đại diện cho 50% dữ liệu ở giữa. Không bị ảnh hưởng bởi các giá trị ngoại lai. Được sử dụng trong biểu đồ hộp.
Thống kê mẫu ước tính các tham số quần thể. Phương sai mẫu sử dụng n-1 (hiệu chỉnh Bessel) để ước tính không chệch. Phương sai quần thể sử dụng n. Máy tính này cung cấp cả hai. Sử dụng thống kê mẫu khi phân tích một tập con của một quần thể lớn hơn.
Tính toán hơn 15 chỉ số thống kê ngay lập tức. Không cần tính toán riêng lẻ từng chỉ số. Tiết kiệm thời gian và giảm lỗi tính toán.
Hoàn hảo cho việc học thống kê. Xem tất cả các chỉ số đồng thời để hiểu mối quan hệ của chúng. Giúp xác minh các tính toán thủ công.
Có thể xử lý hàng ngàn điểm dữ liệu. Không cần tính toán thủ công. Kết quả tức thì bất kể kích thước tập dữ liệu.
Tất cả các tính toán được thực hiện trong trình duyệt của bạn. Không có dữ liệu nào được gửi đến máy chủ. Dữ liệu nhạy cảm vẫn an toàn.
Kết quả được định dạng rõ ràng với các nhãn. Dễ dàng sao chép và dán vào báo cáo. Thích hợp cho sử dụng học thuật và chuyên nghiệp.
Không cần cài đặt phần mềm hoặc đăng ký. Sử dụng không giới hạn.
Hỗ trợ các định dạng phân cách bằng dấu phẩy (10, 20, 30), phân cách bằng dấu cách (10 20 30) và phân cách bằng ngắt dòng. Chọn bất kỳ định dạng nào thuận tiện nhất.
Nếu trung bình và trung vị rất khác nhau, dữ liệu có thể có các giá trị ngoại lai. Trung vị bền vững hơn với các giá trị ngoại lai. Ví dụ: [10, 20, 30, 1000] → trung bình=265, trung vị=25.
SD nhỏ có nghĩa là dữ liệu tập trung gần trung bình. SD lớn có nghĩa là dữ liệu trải rộng. Trong phân phối chuẩn, ±1 SD chứa ~68% dữ liệu, ±2 SD chứa ~95%.
Các giá trị ngoại lai thường được định nghĩa là các giá trị < Q1-1.5×IQR hoặc > Q3+1.5×IQR. Đây là phương pháp tiêu chuẩn được sử dụng trong biểu đồ hộp.
Thống kê quần thể mô tả toàn bộ quần thể (tất cả dữ liệu). Thống kê mẫu mô tả một tập con được sử dụng để ước tính các tham số quần thể. Phương sai mẫu sử dụng n-1 (hiệu chỉnh Bessel) để ước tính không chệch. Sử dụng thống kê mẫu khi phân tích một mẫu của một quần thể lớn hơn.
Sử dụng trung bình khi dữ liệu đối xứng và không có giá trị ngoại lai. Sử dụng trung vị khi dữ liệu có giá trị ngoại lai hoặc bị lệch. Ví dụ: dữ liệu thu nhập hộ gia đình thường sử dụng trung vị vì một vài thu nhập rất cao làm lệch trung bình.
Độ lệch chuẩn đo lường mức độ trải rộng của dữ liệu so với trung bình. SD nhỏ có nghĩa là dữ liệu tập trung gần trung bình (nhất quán). SD lớn có nghĩa là dữ liệu trải rộng (biến thiên). Trong phân phối chuẩn, ±1 SD chứa ~68% dữ liệu.
Yếu vị xác định giá trị phổ biến nhất. Hữu ích cho dữ liệu phân loại hoặc dữ liệu rời rạc. Ví dụ: kích thước sản phẩm phổ biến nhất, điểm thi phổ biến nhất. Dữ liệu có thể không có yếu vị, một yếu vị (unimodal), hoặc nhiều yếu vị (bimodal, multimodal).
Tứ phân vị chia dữ liệu đã sắp xếp thành bốn phần bằng nhau. Q1 (tứ phân vị thứ nhất) là phân vị thứ 25. Q3 (tứ phân vị thứ ba) là phân vị thứ 75. Q2 là trung vị (phân vị thứ 50). Chúng giúp hiểu sự phân bố dữ liệu.
IQR (Khoảng tứ phân vị) = Q3 - Q1. Đại diện cho 50% dữ liệu ở giữa. Không bị ảnh hưởng bởi các giá trị ngoại lai. Được sử dụng để xác định các giá trị ngoại lai: các giá trị < Q1-1.5×IQR hoặc > Q3+1.5×IQR được coi là ngoại lai.
Có, máy tính này hỗ trợ số thập phân. Nhập chúng bằng dấu chấm thập phân (ví dụ: 1.5, 2.7, 3.14). Hữu ích cho các phép đo, tỷ lệ phần trăm và dữ liệu chính xác.
Không có giới hạn nghiêm ngặt, nhưng các tập dữ liệu rất lớn (hơn 100.000 điểm) có thể làm chậm trình duyệt. Đối với hầu hết các mục đích thực tế (lên đến 10.000 điểm), các tính toán là tức thời.
Tính trung bình, trung vị và độ lệch chuẩn
Tính trung bình số trang xem mỗi phiên
Tính thời gian trung bình trên trang
Tính phần trăm và tỷ lệ thay đổi
Thực hiện phép chia theo thời gian thực
Tính chi phí sử dụng API chi tiết