Đặc điểm định lượng những mối quan lại hệ rất có thể thu được bằng phương pháp tính toán hệ số tương quan.
Phân tích đối sánh trong Excel
Bản thân tính năng có vẻ ngoài chung CORREL (mảng1, mảng2). Trong trường "Mảng 1", hãy nhập tọa độ của phạm vi ô của một trong những giá trị, sự phụ thuộc của cực hiếm đó sẽ tiến hành xác định. Như chúng ta cũng có thể thấy, hệ số đối sánh ở dạng số mở ra trong ô mà chúng ta đã lựa chọn trước đó. Một hành lang cửa số với những tham số phân tích tương quan sẽ mở ra. Không giống như phương pháp trước, vào trường "Khoảng đầu vào", shop chúng tôi nhập khoảng không cho từng cột hiếm hoi mà cho tất cả các cột gia nhập phân tích. Như bạn có thể thấy, ứng dụng Excel cung cấp hai phương thức phân tích đối sánh cùng một lúc.
Bạn đang xem: Tính hệ số tương quan trong excel
biểu đồ đối sánh tương quan trong excel
6) bộ phận đầu tiên của bảng sau cùng sẽ lộ diện ở ô bên trên bên trái của vùng sẽ chọn. Vì đó, mang thuyết H0 bị chưng bỏ, tức là các tham số hồi quy cùng hệ số đối sánh không khác 0 ngẫu nhiên, mà lại có ý nghĩa sâu sắc thống kê. 7. Các ước lượng nhận được của phương trình hồi quy mang đến phép bọn họ sử dụng nó để tham dự báo.
Cách tính hệ số tương quan trong Excel
Nếu hệ số là 0, điều này cho biết rằng không tồn tại mối dục tình giữa những giá trị. Để tìm quan hệ giữa các biến và y, hãy thực hiện hàm tích hòa hợp sẵn của Microsoft Excel "CORREL". Ví dụ: so với "Array1", hãy chọn các cực hiếm y và đối với "Array2" nên chọn các giá trị x. Kết quả là các bạn sẽ nhận được hệ số đối sánh tương quan do chương trình tính toán. Tiếp theo, bạn cần đo lường sự khác hoàn toàn giữa từng x, xav với yav. Trong các ô đang chọn, viết bí quyết x-x, y-. Đừng quên ghim các ô có mức giá trị trung bình. Tác dụng thu được đang là hệ số đối sánh tương quan mong muốn.
Công thức tính hệ số Pearson ở trên cho biết thêm quá trình này tốn kém ra làm sao nếu được tiến hành thủ công. đồ vật hai, vui lòng lời khuyên loại phân tích đối sánh tương quan nào rất có thể được sử dụng cho các mẫu khác nhau với phân tán dữ liệu lớn? Làm biện pháp nào để tôi có thể thống kê sự khác hoàn toàn giữa team trên 60 tuổi và những người dân khác?
Tự làm: thống kê giám sát tương quan liêu tiền tệ bởi Excel
Ví dụ, công ty chúng tôi sử dụng Microsoft Excel, nhưng bất kỳ chương trình làm sao khác rất có thể sử dụng công thức đối sánh tương quan sẽ làm cho được. 7. Sau đó, chọn những ô có tài liệu về EUR / USD. 9.Nhấn Enter để đo lường và thống kê hệ số đối sánh cho EUR / USD cùng USD / JPY. Không xứng đáng để update các con số từng ngày (tốt, trừ khi chúng ta bị ám ảnh bởi những mối đối sánh tiền tệ).
Bạn đã chạm mặt phải nhu cầu đo lường và thống kê mức độ tình dục giữa hai số liệu thống kê lại và xác định công thức nhưng mà chúng tương quan với nhau? Để làm điều này, tôi đã thực hiện hàm CORREL (CORREL) - tất cả một chút tin tức về nó sinh hoạt đây. Nó trả về nút độ đối sánh giữa hai phạm vi dữ liệu. Về mặt lý thuyết, hàm tương quan hoàn toàn có thể được tinh chỉnh bằng cách chuyển đổi nó từ tuyến tính thanh lịch hàm mũ hoặc logarit. Phân tích tài liệu và vật thị đối sánh có thể nâng cao độ tin yêu của nó rất đáng kể.
Giả sử ô B2 cất chính thông số tương quan, ô B3 chứa số lượng quan ngay cạnh đầy đủ. Chúng ta có công sở nói giờ đồng hồ Nga không? Nhân tiện, tôi cũng phát chỉ ra một sai lạc - ý nghĩa sâu sắc không được tính cho những mối tương quan âm. Nếu cả hai biến đổi đều là chỉ số và có phân phối bình thường, thì sự lựa chọn là thiết yếu xác. Và, liệu rất có thể mô tả tiêu chí về độ giống như nhau của các đường cong chỉ bằng một QC không? Bạn không tồn tại sự giống nhau của "đường cong", tuy thế sự như thể nhau của hai chuỗi, về nguyên tắc, có thể được mô tả bằng một mặt đường cong.
Bạn đã từng gặp mặt phải nhu cầu đo lường và tính toán mức độ quan hệ giới tính giữa hai đại lượng thống kê và khẳng định công thức cơ mà chúng tương quan với nhau chưa? Người bình thường người ta hoàn toàn có thể hỏi nguyên nhân điều này lại cần thiết. Thật kỳ lạ, vấn đề đó thực sự nên thiết. Biết được các mối tương quan an toàn có thể giúp đỡ bạn kiếm tiền nếu khách hàng là một nhà sale chứng khoán. Sự việc là vì nguyên nhân nào này mà không ai tiết lộ những mối tương quan này (đáng ngạc nhiên, phải không?).
Hãy trường đoản cú đếm chúng! Ví dụ, tôi quyết định thử thống kê giám sát mối đối sánh tương quan của đồng rúp so với đồng đô la thông qua đồng euro. Hãy coi làm thế nào điều này được tiến hành chi tiết.
Bài viết này được thiết kế để cải thiện kiến thức về Microsoft Excel. Ví như bạn không tồn tại thời gian để đọc tổng thể bài viết, bạn cũng có thể tải xuống tệp và tự xử lý.
Nếu bạn thường thấy mình rất cần phải làm điều nào đấy như chũm này Tôi thực thụ khuyên chúng ta nên suy nghĩ mua cuốn sách. Tính toán thống kê trong Excel.
Điều quan liêu trọng cần biết về các mối tương quan
Để thống kê giám sát một mối đối sánh đáng tin cậy, rất cần được có một chủng loại đáng tin cậy, nó càng mập thì kết quả sẽ càng xứng đáng tin cậy. Với mục đích của ví dụ này, tôi đã đưa một mẫu tỷ giá hối hận đoái hàng ngày trong rộng 10 năm. Dữ liệu có sẵn miễn phí, tôi rước từ trang web http://oanda.com.
Tôi đang thực sự có tác dụng gì
(1) lúc tôi có tài liệu ban đầu, tôi bước đầu bằng phương pháp kiểm tra mức độ tương quan giữa nhị tập dữ liệu. Để có tác dụng điều này, tôi đã thực hiện hàm CORREL (CORREL) - có rất ít tin tức về nó. Nó trả về mức độ đối sánh tương quan giữa nhì phạm vi dữ liệu. Thành thật cơ mà nói, hiệu quả không đặc biệt tuyệt vời (chỉ khoảng 70%). Nói chung, nấc độ đối sánh tương quan giữa hai giá trị được coi là bình phương của quý hiếm này, tức là, mối tương quan hóa ra bao gồm độ tin cậy xấp xỉ 49%. Điều này là hết sức ít!
(2) Nó bên cạnh đó rất lạ đối với tôi. Những lỗi nào hoàn toàn có thể xảy ra trong đo lường của tôi? bởi vậy, tôi đưa ra quyết định xây dựng một biểu đồ cùng xem điều gì rất có thể xảy ra. Biểu vật dụng được giữ đơn giản theo mục đích, được chia nhỏ dại theo năm để bạn có thể trực quan liêu thấy mối đối sánh bị phá vỡ ở đâu. Biểu đồ dùng trông như thế này

(3) tự biểu đồ, cụ thể là vào phạm vi khoảng tầm 35 rúp / euro, mối tương quan bước đầu chia thành nhì phần. Chính vì điều này, cô ấy đã trở thành không đáng tin cậy. Nó là quan trọng để khẳng định liên quan tới các gì điều này đang xảy ra.
(4) color sắc cho biết những tài liệu này tham chiếu mang lại năm 2007, 2008, 2009. Cứng cáp chắn! các giai đoạn tài chính đỉnh cao và suy thoái và phá sản thường không an toàn và đáng tin cậy về khía cạnh thống kê, đã xảy ra trong trường thích hợp này. Vị đó, tôi đã cố gắng loại trừ những giai đoạn này khỏi tài liệu (tốt, nhằm xác minh, tôi đã đánh giá mức độ đối sánh tương quan của tài liệu trong tiến trình này). Nút độ đối sánh của chỉ những tài liệu này là 0,01%, nghĩa là về phép tắc nó ko có. Nhưng không có chúng, dữ liệu tương quan khoảng 81%. Đây đã là 1 mối tương quan khá đáng tin cậy. Đây là 1 trong những đồ thị với một hàm.

Bước tiếp theo
Về khía cạnh lý thuyết, hàm tương quan hoàn toàn có thể được tinh chỉnh bằng phương pháp chuyển đổi nó từ con đường tính lịch sự hàm nón hoặc logarit. Trong số ấy giá trị thống kê đối sánh tương quan tăng khoảng một trong những phần trăm, tuy nhiên mức độ tinh vi của việc vận dụng công thức tăng thêm rất nhiều. Vì chưng vậy, đối với bản thân tôi, tôi đặt ra câu hỏi: bao gồm thực sự cần thiết không? Bạn đưa ra quyết định - mang lại từng trường hợp nạm thể.
Lưu ý! chiến thuật cho vấn đề cụ thể của các bạn sẽ trông tựa như ví dụ này, bao hàm tất cả những bảng và văn phiên bản giải thích bên dưới, nhưng tất cả tính mang đến dữ liệu ban đầu của các bạn ...Nhiệm vụ:Có một mẫu liên quan gồm 26 cặp quý giá (x k, y k):
k | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
x k | 25.20000 | 26.40000 | 26.00000 | 25.80000 | 24.90000 | 25.70000 | 25.70000 | 25.70000 | 26.10000 | 25.80000 |
y k | 30.80000 | 29.40000 | 30.20000 | 30.50000 | 31.40000 | 30.30000 | 30.40000 | 30.50000 | 29.90000 | 30.40000 |
k | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
x k | 25.90000 | 26.20000 | 25.60000 | 25.40000 | 26.60000 | 26.20000 | 26.00000 | 22.10000 | 25.90000 | 25.80000 |
y k | 30.30000 | 30.50000 | 30.60000 | 31.00000 | 29.60000 | 30.40000 | 30.70000 | 31.60000 | 30.50000 | 30.60000 |
k | 21 | 22 | 23 | 24 | 25 | 26 |
x k | 25.90000 | 26.30000 | 26.10000 | 26.00000 | 26.40000 | 25.80000 |
y k | 30.70000 | 30.10000 | 30.60000 | 30.50000 | 30.70000 | 30.80000 |
Nó được yêu mong để đo lường / xây dựng: - hệ số tương quan; - kiểm định giả thuyết về sự phụ thuộc của những biến tình cờ X và Y, cùng với mức ý nghĩa α = 0,05; - hệ số phương trình hồi quy đường tính;- biểu thiết bị phân tán (trường tương quan) với đồ thị mặt đường hồi quy;
QUYẾT ĐỊNH:
1. Tính hệ số tương quan.
Hệ số tương quan là một trong chỉ báo về tác động xác suất lẫn nhau của hai vươn lên là ngẫu nhiên. Hệ số đối sánh tương quan R rất có thể lấy cực hiếm từ -1 trước +1. Trường hợp giá trị tuyệt vời nhất gần với 1, thì đây là bằng bệnh kết nối khỏe khoắn giữa những giá trị và nếu sát hơn 0- sau đó, nó chỉ ra rằng một liên kết yếu hoặc không có nó. Nếu giá trị tuyệt vời nhất R bởi một, thì chúng ta cũng có thể nói về mối quan hệ hàm số giữa các đại lượng, nghĩa là, một đại lượng này có thể được biểu diễn dưới dạng đại lượng khác bằng cách sử dụng một hàm toán học.
Bạn hoàn toàn có thể tính toán hệ số tương quan bằng cách sử dụng những công thức sau:Σ |
k = 1 |
= | 1 |
N |
Σ |
k = 1 |
hoặc theo công thức
= | M xy - M x M y |
SxSy |
Mx | = | 1 |
N |
Σ |
k = 1 |
N |
Σ |
k = 1 |
N |
Σ |
k = 1 |
S x 2 | = | 1 |
N |
Σ |
k = 1 |
N |
Σ |
k = 1 |
Trong thực tế, cách làm (1.4) thường xuyên được áp dụng hơn để tính thông số tương quan, bởi nó đòi hỏi ít thống kê giám sát hơn. Mặc dù nhiên, nếu như hiệp phương sai sẽ được đo lường trước kia cov (X, Y), thì việc áp dụng công thức (1.1) sẽ bổ ích hơn vì ngoại trừ giá trị thực của hiệp phương sai, chúng ta cũng có thể sử dụng hiệu quả của các phép tính trung gian.
1.1 Tính hệ số đối sánh tương quan theo công thức (1.4) do vậy, công ty chúng tôi tính các giá trị x k 2, y k 2 cùng x k y k và nhập chúng nó vào bảng 1.
Bảng 1
k | x k | y k | x k 2 | y k 2 | x ky k |
1 | 2 | 3 | 4 | 5 | 6 |
1 | 25.2 | 30.8 | 635.04000 | 948.64000 | 776.16000 |
2 | 26.4 | 29.4 | 696.96000 | 864.36000 | 776.16000 |
3 | 26.0 | 30.2 | 676.00000 | 912.04000 | 785.20000 |
4 | 25.8 | 30.5 | 665.64000 | 930.25000 | 786.90000 |
5 | 24.9 | 31.4 | 620.01000 | 985.96000 | 781.86000 |
6 | 25.7 | 30.3 | 660.49000 | 918.09000 | 778.71000 |
7 | 25.7 | 30.4 | 660.49000 | 924.16000 | 781.28000 |
8 | 25.7 | 30.5 | 660.49000 | 930.25000 | 783.85000 |
9 | 26.1 | 29.9 | 681.21000 | 894.01000 | 780.39000 |
10 | 25.8 | 30.4 | 665.64000 | 924.16000 | 784.32000 |
11 | 25.9 | 30.3 | 670.81000 | 918.09000 | 784.77000 |
12 | 26.2 | 30.5 | 686.44000 | 930.25000 | 799.10000 |
13 | 25.6 | 30.6 | 655.36000 | 936.36000 | 783.36000 |
14 | 25.4 | 31 | 645.16000 | 961.00000 | 787.40000 |
15 | 26.6 | 29.6 | 707.56000 | 876.16000 | 787.36000 |
16 | 26.2 | 30.4 | 686.44000 | 924.16000 | 796.48000 |
17 | 26 | 30.7 | 676.00000 | 942.49000 | 798.20000 |
18 | 22.1 | 31.6 | 488.41000 | 998.56000 | 698.36000 |
19 | 25.9 | 30.5 | 670.81000 | 930.25000 | 789.95000 |
20 | 25.8 | 30.6 | 665.64000 | 936.36000 | 789.48000 |
21 | 25.9 | 30.7 | 670.81000 | 942.49000 | 795.13000 |
22 | 26.3 | 30.1 | 691.69000 | 906.01000 | 791.63000 |
23 | 26.1 | 30.6 | 681.21000 | 936.36000 | 798.66000 |
24 | 26 | 30.5 | 676.00000 | 930.25000 | 793.00000 |
25 | 26.4 | 30.7 | 696.96000 | 942.49000 | 810.48000 |
26 | 25.8 | 30.8 | 665.64000 | 948.64000 | 794.64000 |
1.2.1. x k
x 1 + x 2 + ... + x 26 = 25.20000 + 26.40000 + ... + 25.80000 = 669.500000
1.2.2.
669.50000 / 26 = 25.75000
M x = 25,750000
1.3. Tương tự, ta tính M y.
1.3.1. Hãy thêm toàn bộ các thành phần theo đồ vật tự y k
y 1 + y 2 +… + y 26 = 30.80000 + 29.40000 +… + 30.80000 = 793.000000
1.3.2. chia tổng hiệu quả cho số phần tử mẫu
793.00000 / 26 = 30.50000
M y = 30.500000
1.4. Tương tự, ta tính M xy.
1.4.1. chúng tôi thêm tuần tự toàn bộ các bộ phận của cột thiết bị 6 của bảng 1
776.16000 + 776.16000 + ... + 794.64000 = 20412.830000
1.4.2. phân tách tổng hiệu quả cho số phần tử
20412.83000 / 26 = 785.10885
M xy = 785.108846
1.5. Tính cực hiếm của S x 2 bởi công thức (1.6.).
1.5.1. công ty chúng tôi thêm tuần tự tất cả các thành phần của cột sản phẩm công nghệ 4 của bảng 1
635.04000 + 696.96000 + ... + 665.64000 = 17256.910000
1.5.2. phân tách tổng tác dụng cho số phần tử
17256.91000 / 26 = 663.72731
1.5.3. Trừ số ở đầu cuối bình phương của quý giá M x ta được giá trị S x 2
S x 2 = 663.72731 - 25.75000 2 = 663.72731 - 663.06250 = 0.66481
1.6. Tính quý giá của S y 2 theo công thức (1.6.).
1.6.1. shop chúng tôi thêm tuần tự tất cả các phần tử của cột sản phẩm công nghệ 5 của bảng 1
948.64000 + 864.36000 + ... + 948.64000 = 24191.840000
1.6.2. chia tổng công dụng cho số phần tử
24191.84000 / 26 = 930.45538
1.6.3. Trừ số sau cuối bình phương của M y, ta giá tốt trị của S y 2
S y 2 = 930.45538 - 30.50000 2 = 930.45538 - 930.25000 = 0.20538
1.7. Hãy tính tích của S x 2 và S y 2.
S x 2 S y 2 = 0,66481 0,20538 = 0,136541
1.8. Trích số sau cùng Căn bậc hai, bọn họ nhận được giá trị S x S y.
S x S y = 0,36951
1.9. Tính cực hiếm của hệ số đối sánh tương quan theo công thức (1.4.).
R = (785.10885 - 25,75000 30.50000) / 0,36951 = (785.10885 - 785.37500) / 0,36951 = -0,72028
TRẢ LỜI: Rx, y = -0,720279
2. Công ty chúng tôi kiểm tra chân thành và ý nghĩa của hệ số đối sánh tương quan (chúng tôi soát sổ giả thuyết phụ thuộc).
Vì cầu lượng của hệ số tương quan được tính toán trên một mẫu hữu hạn, và vị đó rất có thể sai lệch so với mức giá trị thông thường của nó, nên rất cần được kiểm tra ý nghĩa sâu sắc của thông số tương quan. Việc kiểm tra được thực hiện bằng cách sử dụng tiêu chuẩn t:
t = | Rx, y | ||
√ | n - 2 |
√ | 1 - R 2 x, y |
Giá trị ngẫu nhiên t theo triển lẵm t của Student với theo bảng phân phối t, nên tìm cực hiếm tới hạn của tiêu chí (t cr.α) sống mức chân thành và ý nghĩa cho trước α. Trường hợp modulo t được xem theo cách làm (2.1) nhỏ tuổi hơn t cr.α, thì sự phụ thuộc vào giữa biến đột nhiên X và Y không. Nếu không, dữ liệu thực nghiệm không xích míc với mang thuyết về sự nhờ vào của các biến ngẫu nhiên.
2.1. Tính cực hiếm của tiêu thức t theo cách làm (2.1) ta được:t = | -0.72028 | ||
√ | 26 - 2 |
√ | 1 - (-0.72028) 2 |
Giá trị mong ước t kr.α nằm ở vị trí giao điểm của hàng ứng với số bậc thoải mái và cột ứng với mức chân thành và ý nghĩa α đến trước. Trong trường hợp của bọn chúng ta, số bậc tự do thoải mái là n - 2 = 26 - 2 = 24 cùng α = 0.05, tương ứng với giá trị tới hạn của tiêu chí t cr.α = 2.064(xem bảng 2)
ban 2 cung cấp t
Số bậc tự do thoải mái (n - 2) | α = 0,1 | α = 0,05 | α = 0,02 | α = 0,01 | α = 0,002 | α = 0,001 |
1 | 6.314 | 12.706 | 31.821 | 63.657 | 318.31 | 636.62 |
2 | 2.920 | 4.303 | 6.965 | 9.925 | 22.327 | 31.598 |
3 | 2.353 | 3.182 | 4.541 | 5.841 | 10.214 | 12.924 |
4 | 2.132 | 2.776 | 3.747 | 4.604 | 7.173 | 8.610 |
5 | 2.015 | 2.571 | 3.365 | 4.032 | 5.893 | 6.869 |
6 | 1.943 | 2.447 | 3.143 | 3.707 | 5.208 | 5.959 |
7 | 1.895 | 2.365 | 2.998 | 3.499 | 4.785 | 5.408 |
8 | 1.860 | 2.306 | 2.896 | 3.355 | 4.501 | 5.041 |
9 | 1.833 | 2.262 | 2.821 | 3.250 | 4.297 | 4.781 |
10 | 1.812 | 2.228 | 2.764 | 3.169 | 4.144 | 4.587 |
11 | 1.796 | 2.201 | 2.718 | 3.106 | 4.025 | 4.437 |
12 | 1.782 | 2.179 | 2.681 | 3.055 | 3.930 | 4.318 |
13 | 1.771 | 2.160 | 2.650 | 3.012 | 3.852 | 4.221 |
14 | 1.761 | 2.145 | 2.624 | 2.977 | 3.787 | 4.140 |
15 | 1.753 | 2.131 | 2.602 | 2.947 | 3.733 | 4.073 |
16 | 1.746 | 2.120 | 2.583 | 2.921 | 3.686 | 4.015 |
17 | 1.740 | 2.110 | 2.567 | 2.898 | 3.646 | 3.965 |
18 | 1.734 | 2.101 | 2.552 | 2.878 | 3.610 | 3.922 |
19 | 1.729 | 2.093 | 2.539 | 2.861 | 3.579 | 3.883 |
20 | 1.725 | 2.086 | 2.528 | 2.845 | 3.552 | 3.850 |
21 | 1.721 | 2.080 | 2.518 | 2.831 | 3.527 | 3.819 |
22 | 1.717 | 2.074 | 2.508 | 2.819 | 3.505 | 3.792 |
23 | 1.714 | 2.069 | 2.500 | 2.807 | 3.485 | 3.767 |
24 | 1.711 | 2.064 | 2.492 | 2.797 | 3.467 | 3.745 |
25 | 1.708 | 2.060 | 2.485 | 2.787 | 3.450 | 3.725 |
26 | 1.706 | 2.056 | 2.479 | 2.779 | 3.435 | 3.707 |
27 | 1.703 | 2.052 | 2.473 | 2.771 | 3.421 | 3.690 |
28 | 1.701 | 2.048 | 2.467 | 2.763 | 3.408 | 3.674 |
29 | 1.699 | 2.045 | 2.462 | 2.756 | 3.396 | 3.659 |
30 | 1.697 | 2.042 | 2.457 | 2.750 | 3.385 | 3.646 |
40 | 1.684 | 2.021 | 2.423 | 2.704 | 3.307 | 3.551 |
60 | 1.671 | 2.000 | 2.390 | 2.660 | 3.232 | 3.460 |
120 | 1.658 | 1.980 | 2.358 | 2.617 | 3.160 | 3.373 |
∞ | 1.645 | 1.960 | 2.326 | 2.576 | 3.090 | 3.291 |
Giá trị tuyệt vời nhất tiêu chí t không bé dại hơn t = 5,08680, tcr.α = 2,064, cho nên dữ liệu thực nghiệm, với tỷ lệ 0,95(1 - α), không mâu thuẫn với giả thuyết vào sự phụ thuộc vào của những biến đột nhiên X với Y.
3. Chúng tôi tính toán các hệ số của phương trình hồi quy con đường tính.
Phương trình hồi quy tuyến đường tính là 1 trong phương trình của một đường thẳng thể hiện gần đúng (mô tả ngay gần đúng) mối quan hệ giữa các biến tự nhiên X và Y. Nếu chúng ta giả sử rằng X là tự do và Y phụ thuộc vào vào X, thì phương trình hồi quy sẽ được viết như sau
Y = a + b X (3,1), trong đó:
b = | Rx, y | y |
σ x |
S x |
Hệ số tính theo cách làm (3.2) bđược hotline là thông số hồi quy đường tính. Trong một số nguồn một tập trung hệ số không thay đổi hồi quy cùng b theo những biến.
Sai số dự đoán Y cho 1 giá trị một mực X được xem theo công thức:
Giá trị σ y / x (công thức 3.4) có cách gọi khác là độ lệch chuẩn còn lại, nó đặc thù cho vấn đề Y thoát ra khỏi đường hồi quy được thể hiện bởi phương trình (3.1) trên một giá chỉ trị thắt chặt và cố định (cho trước) của X.
3.3 Tính hệ số b theo công thức (3.2)
b = -0.72028 0.55582 = -0.40035
3.4 Tính thông số a theo bí quyết (3.3)
3.5 Ước lượng sai số của phương trình hồi quy.
3.5.1 shop chúng tôi trích xuất căn bậc nhị từ S y 2 cùng nhận được:
δy / x = (0,31437 / 30.50000) 100% = 1,03073%
4. Bọn họ xây dựng biểu đồ dùng phân tán (trường tương quan) và đồ thị của con đường hồi quy.
Scatterplot là hình ảnh đồ họa các cặp khớp ứng (x k, y k) ngơi nghỉ dạng những điểm của khía cạnh phẳng, trong Tọa độ hình chữ nhật với trục X cùng Y. Trường đối sánh tương quan là giữa những biểu diễn giao diện mẫu được links (ghép nối). Trong cùng một hệ tọa độ, vật dụng thị của đường hồi quy cũng được vẽ. Các thang đo và điểm bước đầu trên các trục đề xuất được chọn cẩn thận để sơ vật dụng càng rõ ràng càng tốt.4.1. Ta tìm được phần tử nhỏ nhất và lớn số 1 của chủng loại X thứu tự là bộ phận thứ 18 với 15, x min = 22.10000 với x max = 26.60000.
4.2. Ta thấy phần tử nhỏ tuổi nhất và lớn nhất của chủng loại Y theo lần lượt là phần tử thứ 2 với thứ 18, y min = 29.40000 và y max = 31.60000.
4.3. bên trên trục abscissa, công ty chúng tôi chọn điểm ban đầu ngay bên trái của điểm x 18 = 22.10000, cùng tỷ lệ sao để cho điểm x 15 = 26.60000 nằm trong trục và các điểm không giống được biệt lập rõ ràng.
4.4. trên trục y, cửa hàng chúng tôi chọn điểm bước đầu ngay phía bên trái của điểm y 2 = 29.40000, với tỷ lệ sao để cho điểm y 18 = 31.60000 nằm ở trục và những điểm không giống được rõ ràng rõ ràng.
4.5. bên trên trục abscissa, chúng ta đặt những giá trị x k và trên trục tọa độ, họ đặt các giá trị y k.
4.6. shop chúng tôi đặt các điểm (x 1, y 1), (x 2, y 2), ..., (x 26, y 26) xung quanh phẳng tọa độ. Shop chúng tôi nhận được một biểu đồ gia dụng phân tán (trường tương quan), được hiển thị trong hình mặt dưới.
4.7. Hãy vẽ một đường hồi quy.
Để làm điều này, công ty chúng tôi tìm thấy hai các điểm khác nhau với tọa độ (x r1, y r1) cùng (x r2, y r2) thỏa mãn nhu cầu phương trình (3.6), ta đặt nó trên khía cạnh phẳng tọa độ cùng vẽ một mặt đường thẳng qua chúng. Hãy đem x min = 22.10000 là abscissa của điểm đầu tiên. Cụ giá trị của x min vào phương trình (3.6), ta được hoành độ của điểm đầu tiên. Như vậy, chúng ta có một điểm bao gồm tọa độ (22.10000, 31.96127). Tương tự, chúng ta thu được tọa độ của điểm máy hai, đặt cực hiếm x max = 26.60000 làm abscissa. Điểm đồ vật hai sẽ là: (26.60000, 30.15970).
Đường hồi quy được hiển thị trong hình dưới với red color
Xin để ý rằng mặt đường hồi quy luôn đi qua điểm của những giá trị trung bình của X cùng Y, có nghĩa là với tọa độ (M x, M y).
CÔNG TÁC LAO ĐỘNG
PHÂN TÍCH LỖI TRONGEXCEL
1.1 Phân tích đối sánh trong MS Excel
Phân tích tương quan bao hàm việc xác định mức độ kết nối giữa nhì biến bỗng nhiên X và Y. Hệ số tương quan được thực hiện làm thước đo mang đến mối contact đó. Hệ số đối sánh tương quan được cầu tính trường đoản cú mẫu trọng lượng n của những cặp quan liêu sát liên quan (x i, y i) từ tổng thể và toàn diện chung X cùng Y. Để review mức độ tình dục giữa X với Y được đo bởi thang định lượng, công ty chúng tôi sử dụng hệ số đối sánh tương quan tuyến tính(Hệ số Pearson), giả sử rằng những mẫu X và Y được cung cấp theo luật chuẩn.
Hệ số tương quan thay đổi từ -1 (quan hệ tuyến tính nghịch đảo chặt chẽ) mang lại 1 (quan hệ xác suất thuận chặt chẽ). Ở quý giá 0, không có mối quan lại hệ con đường tính giữa hai mẫu.
Phân các loại chung những mối đối sánh (theo Ivanter E.V., Korosov A.V., 1992):
Có một số trong những loại hệ số tương quan, tùy nằm trong vào các biến X với Y, hoàn toàn có thể được giám sát trên những thang đo khác nhau. Chính thực tế này ra quyết định việc lựa chọn hệ số tương quan phù hợp (xem Bảng 13):
Trong MS Excel, một hàm đặc biệt được sử dụng để giám sát các hệ số đối sánh tương quan tuyến tính được ghép nối CORREL (array1; array2),
№ đối tượng kiểm tra | ||
Ví dụ 1: 10 học viên đã được thiết kế các bài kiểm tra về bốn duy bằng khẩu ca và hình ảnh. Thời hạn trung bình để giải quyết và xử lý các trách nhiệm thử nghiệm được xem bằng giây. Công ty nghiên cứu cân nhắc câu hỏi: có quan hệ giữa thời gian giải quyết và xử lý các sự việc này không? biến X biểu hiện thời gian trung bình nhằm giải các bài soát sổ trực quan tiền và biến hóa Y biểu hiện thời gian trung bình để giải những bài kiểm tra bởi lời nói.
R

Trong hộp thoại Trình phía dẫn tác dụng xuất hiện, hãy lựa chọn 1 danh mục những thống kê và công dụng CORREL, sau đó bấm OK. Thực hiện con trỏ chuột để nhập phạm vi dữ liệu mẫu X vào trường array1 (A1: A10). Trong trường array2, nhập dải tài liệu mẫu Y (B1: B10). Bấm OK. Vào ô C1, quý giá của hệ số đối sánh sẽ lộ diện - 0,54119. Tiếp theo, bạn cần nhìn vào số tuyệt đối của hệ số đối sánh tương quan và xác định loại mối quan hệ (gần, yếu, trung bình, v.v.)
Cơm. 1. Tác dụng tính toán thông số tương quan
Do đó, mối contact giữa thời gian giải quyết các nhiệm vụ trực quan lại và khẩu ca của bài xích kiểm tra vẫn không được chứng minh.
Bài tập 1. tài liệu có sẵn cho trăng tròn cơ sở nông nghiệp. Để kiếm tìm Hệ số tương quan giữa năng suất cây cối có hạt với unique đất và đánh giá ý nghĩa sâu sắc của nó. Tài liệu được chỉ dẫn trong bảng.
Bảng 2. Sự dựa vào của năng suất cây lương thực vào unique đất
số nhà | Chất lượng đất, điểm số | Năng suất, c / ha |
Nhiệm vụ 2. khẳng định xem có mối quan hệ nào thân thời gian hoạt động vui chơi của máy đồng đội dục thể thao (nghìn giờ) và túi tiền sửa chữa (nghìn rúp) xuất xắc không:
Thời gian hoạt động vui chơi của trình mô rộp (nghìn giờ) | Chi phí sửa chữa (nghìn rúp) |
1.2 tương quan nhiều trong MS Excel
Tại con số lớn quan lại sát, khi các hệ số tương quan cần được giám sát tuần từ cho một trong những mẫu, để thuận tiện, những hệ số tác dụng được bắt tắt vào bảng được call là ma trận tương quan.
Ma trận tương quan là 1 bảng vuông trong số đó tại giao điểm của các hàng cùng cột tương xứng là hệ số tương quan giữa các tham số tương ứng.
Trong MS Excel, quá trình được áp dụng để tính toán ma trận đối sánh tương quan tương quan trường đoản cú gói Phân tích dữ liệu. quy trình này giúp có được một ma trận đối sánh chứa các hệ số đối sánh tương quan giữa các tham số không giống nhau.
Để thực hiện quy trình, chúng ta phải:
1. Chạy lệnh Dịch vụ- Phân tíchdữ liệu;
2. Trong danh sách mở ra Công thay phân tích chọn cái Tương quan với nhấn nút ĐƯỢC RỒI;
3. Trong hộp thoại xuất hiện, chỉ định khoảng thời gian đầu vào có nghĩa là nhập một links đến những ô chứa dữ liệu được phân tích. Khoảng nguồn vào phải chứa tối thiểu hai cột.
4. Phần nhóm lạiđặt công tắc theo dữ liệu đã nhập (theo cột hoặc theo hàng);
5. đã cho thấy ngày nghỉkhoảng thời gian tức là, nhập một tham chiếu mang lại ô, bước đầu từ đó công dụng phân tích sẽ được hiển thị. Kích thước của phạm vi đầu ra sẽ được xác định tự động và một thông báo sẽ được hiển thị trên màn hình nếu phạm vi đầu ra hoàn toàn có thể trùng lặp với dữ liệu nguồn. Nút ấn ĐƯỢC RỒI.
Một ma trận đối sánh sẽ được hiển thị vào phạm vi đầu ra, trong các số ấy tại giao điểm của từng hàng với cột có hệ số tương quan giữa những tham số tương ứng. Những ô trong phạm vi cổng đầu ra có cùng tọa độ hàng và cột cất giá trị 1 vì chưng mỗi cột trong phạm vi đầu vào hoàn toàn tương quan tiền với chủ yếu nó
Ví dụ 2 dữ liệu hàng tháng có sẵn để quan sát điều kiện thời tiết cùng thăm các viện bảo tàng và khu dã ngoại công viên (xem Bảng 3). Yêu cầu phải xác định xem có mối quan hệ nào giữa chứng trạng thời tiết với việc tham gia các viện kho lưu trữ bảo tàng và khu vui chơi công viên hay không.
Bảng 3. Tác dụng quan sát
Số ngày rõ ràng | Số lượng khách du lịch tham quan bảo tàng | Số lượng khách thăm quan công viên |
Quyết định. Để triển khai phân tích tương quan, hãy nhập dữ liệu ban đầu vào phạm vi A1: G3 (Hình 2). Kế tiếp trên menu Dịch vụ chọn món đồ Phân tíchdữ liệu và tiếp nối thêm loại Tương quan. Trong hộp thoại xuất hiện, hãy nhập khoảng thời hạn đầu vào(A2: C7). Hướng dẫn và chỉ định rằng dữ liệu được xem xét bởi các cột. Hướng đẫn phạm vi cổng đầu ra (E1) với nhấn nút ĐƯỢC RỒI.
Trên hình. 33 rất có thể thấy rằng mối đối sánh giữa điều kiện thời tiết với việc tham dự bảo tàng là -0,92, cùng giữa đk thời máu và vấn đề đến khu dã ngoại công viên - 0,97, giữa việc đến công viên và bảo tàng - 0,92.
Do đó, hiệu quả của việc phân tích, những mối quan tiền hệ dựa vào đã được máu lộ: mối quan hệ tuyến tính nghịch đảo mạnh mẽ giữa việc tham gia bảo tàng và số ngày nắng và mối quan tiền hệ gần như tuyến tính (rất trực tiếp) giữa việc đến công viên và điều kiện thời tiết. Bao gồm một quan hệ nghịch đảo trẻ trung và tràn trề sức khỏe giữa việc tham gia bảo tàng và công viên.

Cơm. 2. Kết quả tính toán ma trận tương quan từ ví dụ như 2
Nhiệm vụ 3. 10 nhà thống trị được đánh giá theo cách thức luận của các chuyên gia đánh giá bán về đặc điểm tâm lý nhân cách ở trong nhà lãnh đạo. 15 chuyên viên đã review từng đặc điểm tâm lý theo hệ thống năm điểm (xem Bảng 4). Nhà tư tưởng học cân nhắc câu hỏi mối quan hệ của những đặc điểm này trong phòng lãnh đạo cùng với nhau.
Bảng 4. Công dụng nghiên cứu
Đối tượng p. / p | khéo léo | tính chính xác | mức độ nghiêm trọng |
Với một mối đối sánh cùng một quý hiếm của một thuộc tính khớp ứng với các giá trị không giống nhau của trực thuộc tính kia. Ví dụ: tất cả mối tương quan giữa độ cao và cân nặng, giữa xác suất mắc các khối u ác tính tính với tuổi tác, v.v.
Có 2 phương thức tính thông số tương quan: phương pháp bình phương (Pearson), phương pháp cấp bậc (Spearman).
Chính xác độc nhất là cách thức bình phương (Pearson), trong số ấy hệ số đối sánh được xác định theo công thức:, trong đó
r xy là hệ số đối sánh tương quan giữa chuỗi thống kê lại X với Y.
d x là độ lệch của mỗi số của chuỗi thống kê X so với giá trị trung bình cùng của nó.
d y là độ lệch của mỗi số của chuỗi những thống kê Y đối với trung bình cộng của nó.
Tùy ở trong vào độ bạo phổi của liên kết và vị trí hướng của nó, hệ số tương quan có thể nằm trong khoảng từ 0 mang đến 1 (-1). Hệ số đối sánh tương quan bằng 0 cho thấy thêm sự thiếu kết nối hoàn toàn. Nút của hệ số tương quan càng gần với cùng 1 hoặc (-1), tương xứng càng lớn, thì thẳng hoặc bình luận được đo bởi nó càng gần. Cùng với hệ số tương quan bằng 1 hoặc (-1), liên kết là trả chỉnh, có chức năng.
Sơ đồ mong tính độ mạnh mẽ của mối đối sánh bằng thông số tương quan
Sức mạnh của kết nối | Giá trị của hệ số tương quan, giả dụ có | |
kết nối thẳng (+) | Phản hồi (-) | |
Không tất cả kết nối | ||
Giao tiếp nhỏ (yếu) | từ 0 đến +0,29 | 0 mang đến -0,29 |
Giao tiếp mức độ vừa phải (vừa phải) | +0,3 mang đến +0,69 | -0,3 đến -0,69 |
Giao tiếp béo (mạnh) | +0,7 đến +0,99 | -0,7 mang đến -0,99 |
Giao tiếp hoàn tất (chức năng) |
Để giám sát và đo lường hệ số đối sánh tương quan bằng phương thức bình phương, một bảng tất cả 7 cột được biên soạn. Hãy so sánh quá trình giám sát và đo lường bằng một ví dụ:
XÁC ĐỊNH SỨC MẠNH VÀ BẢN CHẤT CỦA MỐI quan HỆ GIỮA
Đến cơ hội rồi- ness bướu cổ (V y ) | d x = V x –M x | d y = V y –M y | d x d y | d x 2 | d y 2 | |
Σ -1345,0 | Σ 13996,0 | Σ 313,47 |
1. Xác định hàm lượng vừa đủ của iot trong nước (tính bởi mg / l).

2. Xác định tỷ lệ mắc bệnh bướu cổ vừa đủ theo%.

3. Xác định độ lệch của từng V x so với M x, có nghĩa là d x.
201–138 = 63; 178–138 = 40, v.v.
4. Tương tự, shop chúng tôi xác định độ lệch của từng V y so với M y, tức là d
0,2–3,8 = -3,6; 0,6–38 = -3,2, v.v.
5. Chúng tôi xác định các thành phầm của sự không đúng lệch. Sản phẩm thu được được tổng hợp cùng thu được.

6. Ta bình phương d x cùng tổng hợp kết quả, ta được.

7. Tương tự, ta bình phương d y, tổng phù hợp kết quả, ta được

8. Cuối cùng, shop chúng tôi thay thế toàn bộ số tiền nhận được vào công thức:

Để giải quyết vấn đề về độ tin cậy của hệ số tương quan, nó được khẳng định lỗi mức độ vừa phải theo công thức:

(Nếu số quan lại sát nhỏ hơn 30 thì chủng loại số là n-1).
Trong ví dụ của bọn chúng tôi

Giá trị của thông số tương quan được xem là an toàn và tin cậy nếu nó cao hơn nữa ít duy nhất 3 lần so với không nên số vừa đủ của nó.
Trong ví dụ như của shop chúng tôi
Do đó, hệ số tương quan không đáng tin cậy, vày đó cần được tăng số lượng quan sát.
Hệ số tương quan rất có thể được xác minh theo một phương pháp hơi kém chính xác hơn, nhưng thuận lợi hơn nhiều, cách thức xếp hạng (Spearman).
Phương pháp Spearman: p. = 1- (6∑d 2 / n- (n 2 -1))
tạo thành nhị hàng đối tượng người sử dụng địa lý được so sánh được ghép nối, chỉ định hàng đầu tiên và hàng vật dụng hai, tương ứng, x cùng y. Đồng thời, trình bày bậc nhất tiên của trực thuộc tính theo lắp thêm tự bớt dần hoặc tăng dần và đặt những giá trị số của hàng thiết bị hai đối diện với các giá trị của bậc nhất tiên nhưng chúng tương xứng với
giá trị của đối tượng người sử dụng địa lý trong những hàng được đối chiếu phải được sửa chữa bằng một số sê-ri (thứ hạng). Xếp hạng, hoặc số, cho thấy thêm vị trí của những chỉ số (giá trị) của số 1 tiên cùng hàng trang bị hai. Trong những số ấy Giá trị vẻ bên ngoài số của ở trong tính thứ hai, các cấp bậc đề nghị được chỉ định theo cùng thứ tự đã được chấp nhận khi cung cấp chúng cho các giá trị của ở trong tính đầu tiên. Với những giá trị tương đương nhau của nằm trong tính vào chuỗi, sản phẩm công nghệ hạng bắt buộc được khẳng định là số trung bình từ tổng số thứ tự của những giá trị này
xác định sự khác biệt về kiểu giữa x và y (d): d = x - y
bình phương chênh lệch vật dụng hạng tác dụng (d 2)
lấy tổng bình phương của hiệu (Σ d 2) và thay các giá trị chiếm được vào công thức:
Ví dụ: sử dụng phương thức xếp hạng để tùy chỉnh cấu hình hướng với độ mạnh dạn của mối quan hệ giữa thời gian giao hàng tính theo năm và tần suất chấn thương, nếu như thu được dữ liệu sau:
Cơ sở lý luận của bài toán lựa lựa chọn phương pháp:để giải quyết và xử lý vấn đề, chỉ hoàn toàn có thể chọn phương thức tương quan sản phẩm công nghệ hạng, trên vì bậc nhất tiên của trực thuộc tính "kinh nghiệm làm việc tính theo năm" có những tùy lựa chọn mở (kinh nghiệm thao tác từ 1 năm đến 7 năm trở lên), không chất nhận được sử dụng cách thức chính xác rộng - phương thức bình phương - để thiết lập cấu hình mối quan hệ nam nữ giữa so sánh các đặc điểm.
Quyết định. Trình tự những phép tính được miêu tả trong văn bản, công dụng được trình bày trong Bảng. 2.
ban 2
Kinh nghiệm thao tác làm việc trong nhiều năm | Số lượng yêu đương tích | Số trang bị tự (cấp bậc) | Sự khác biệt về thiết bị hạng | bình phương chênh lệch máy hạng | |
d (x-y) | d 2 | ||||
Mỗi hàng của những dấu hiệu được ghép nối được ký kết hiệu bằng "x" và "y" (cột 1-2).
Giá trị của mỗi tín hiệu được thay thế bằng số hình trạng (số thứ tự). đồ vật tự phân bố các cấp bậc trong chuỗi "x" như sau: giá trị tối thiểu của trực thuộc tính (kinh nghiệm lên tới 1 năm) được gán mang lại số sê-ri "1", những biến thể tiếp theo của và một chuỗi nằm trong tính, tương ứng , theo đồ vật tự tăng dần của những số thứ tự thứ 2, 3, 4 và 5 - các cấp bậc (xem cột 3). Một trang bị tự giống như được quan liền kề khi trưng bày cấp bậc cho đối tượng người sử dụng địa lý máy hai "y" (cột 4). Trong trường vừa lòng có một số trong những biến thể bao gồm cùng form size (ví dụ: vào nguyên công tiêu chuẩn, đấy là 12 cùng 12 thương tích trên 100 công nhân với tay nghề kinh nghiệm từ 3-4 năm với 5-6 năm), số sê-ri được chỉ ra thông qua số trung bình tự tổng các số sê-ri của chúng. Những tài liệu này về số trường vừa lòng bị thương (12 trường hợp bị thương) trong bảng xếp thứ hạng sẽ chiếm vị trí 2 cùng 3, bởi vì vậy số trung bình của bọn chúng là (2 + 3) / 2 = 2,5.) đề xuất phân phối những số xếp hạng giống như nhau - "2,5" (cột 4).
Xem thêm:
Xác định sự khác biệt về dạng hình d = (x - y) - (cột 5)
Bình phương sự khác biệt về hình dáng (d 2) cùng nhận tổng bình phương của sự khác hoàn toàn về thứ hạng Σ d 2 (cột 6).