Cách tính điểm trung bình trong excel. Tính giá trị nhỏ nhất, lớn nhất và trung bình trong Microsoft Excel

Loại trung bình phổ biến nhất là trung bình số học.

trung bình cộng đơn giản

Giá trị trung bình số học đơn giản là thuật ngữ trung bình, trong đó xác định tổng khối lượng của một thuộc tính nhất định trong dữ liệu được phân bổ đều cho tất cả các đơn vị được bao gồm trong tập hợp này. Do đó, sản lượng trung bình hàng năm trên mỗi công nhân là một giá trị của khối lượng sản lượng sẽ rơi vào mỗi nhân viên nếu toàn bộ khối lượng đầu ra được phân bổ đều cho tất cả các nhân viên của tổ chức. Giá trị đơn giản trung bình cộng được tính theo công thức:

trung bình cộng đơn giản- Bằng tỷ lệ giữa tổng các giá trị riêng lẻ của một đối tượng địa lý với số lượng đối tượng địa lý trong tổng thể

ví dụ 1 . Một đội gồm 6 công nhân nhận được 3 3,2 3,3 3,5 3,8 3,1 nghìn rúp mỗi tháng.

Tìm mức lương trung bình
Giải: (3 + 3.2 + 3.3 +3.5 + 3.8 + 3.1) / 6 = 3,32 nghìn rúp.

Bình quân gia quyền số học

Nếu khối lượng của tập dữ liệu lớn và đại diện cho một chuỗi phân phối, thì giá trị trung bình số học có trọng số sẽ được tính. Đây là cách xác định giá bình quân gia quyền trên một đơn vị sản xuất: tổng chi phí sản xuất (tổng số lượng sản phẩm của nó và giá một đơn vị sản xuất) được chia cho tổng số lượng sản xuất.

Chúng tôi biểu diễn điều này dưới dạng công thức sau:

Trung bình cộng có trọng số- bằng tỷ lệ (tổng các tích của giá trị thuộc tính với tần suất lặp lại của thuộc tính này) với (tổng các tần số của tất cả các thuộc tính). Nó được sử dụng khi các biến thể của tổng thể được nghiên cứu xảy ra không bằng nhau số lần.

Ví dụ 2 . Tìm mức lương trung bình của công nhân cửa hàng mỗi tháng

Mức lương trung bình có thể được tính bằng cách lấy tổng số tiền lương chia cho tổng số công nhân:

Trả lời: 3,35 nghìn rúp.

Trung bình số học cho một chuỗi khoảng thời gian

Khi tính giá trị trung bình cộng cho một chuỗi biến thiên theo khoảng, giá trị trung bình của mỗi khoảng trước tiên được xác định là tổng nửa của giới hạn trên và giới hạn dưới, sau đó là trung bình của toàn bộ chuỗi. Trong trường hợp các khoảng mở, giá trị của khoảng dưới hoặc trên được xác định bằng giá trị của các khoảng liền kề với chúng.

Giá trị trung bình được tính từ chuỗi khoảng thời gian là gần đúng.

Ví dụ 3. Xác định tuổi trung bình của sinh viên khoa buổi tối.

Giá trị trung bình được tính từ chuỗi khoảng thời gian là gần đúng. Mức độ gần đúng của chúng phụ thuộc vào mức độ mà phân bố thực tế của các đơn vị dân số trong khoảng tiếp cận đồng nhất.

Khi tính toán giá trị trung bình, không chỉ giá trị tuyệt đối mà cả giá trị tương đối (tần suất) có thể được sử dụng làm trọng số:

Trung bình cộng có một số thuộc tính bộc lộ đầy đủ hơn bản chất của nó và đơn giản hóa việc tính toán:

1. Tích của giá trị trung bình và tổng của các tần số luôn bằng tổng của các tích của biến thể và các tần số, tức là

2. Trung bình cộng của tổng các giá trị thay đổi bằng tổng trung bình cộng của các giá trị này:

3. Tổng đại số của độ lệch của các giá trị riêng lẻ của thuộc tính so với giá trị trung bình bằng 0:

4. Tổng bình phương độ lệch của các tùy chọn so với giá trị trung bình nhỏ hơn tổng bình phương độ lệch từ bất kỳ giá trị tùy ý nào khác, tức là

Cách tính giá trị trung bình của các số trong Excel

Bạn có thể tìm giá trị trung bình cộng của các số trong Excel bằng cách sử dụng hàm.

Cú pháp AVERAGE

= AVERAGE (number1, [number2],…) - Phiên bản tiếng Nga

Đối số AVERAGE

số 1- số hoặc dải số đầu tiên, để tính giá trị trung bình cộng;
số 2(Tùy chọn) - số thứ hai hoặc dải số để tính trung bình cộng. Số đối số hàm tối đa là 255.

Để tính toán, hãy làm theo các bước sau:

Chọn bất kỳ ô nào;
Viết một công thức trong đó = AVERAGE (
Chọn phạm vi ô mà bạn muốn thực hiện phép tính;
Nhấn phím "Enter" trên bàn phím

Hàm sẽ tính giá trị trung bình trong phạm vi được chỉ định giữa các ô có chứa số.

Cách tìm giá trị trung bình cho văn bản

Nếu có dòng hoặc văn bản trống trong phạm vi dữ liệu, thì hàm sẽ coi chúng là "không". Nếu có biểu thức logic FALSE hoặc TRUE trong số dữ liệu, thì hàm sẽ coi FALSE là "không" và TRUE là "1".

Cách tìm giá trị trung bình cộng theo điều kiện

Hàm được sử dụng để tính giá trị trung bình theo một điều kiện hoặc tiêu chí. Ví dụ: giả sử chúng tôi có dữ liệu bán sản phẩm:

Nhiệm vụ của chúng ta là tính toán doanh số bán bút trung bình. Để làm điều này, chúng tôi sẽ thực hiện các bước sau:

Trong một phòng giam A13 viết tên sản phẩm “Bút”;
Trong một phòng giam B13 hãy nhập công thức:

= AVERAGEIF (A2: A10, A13, B2: B10)

Phạm vi ô “ A2: A10”Trỏ đến danh sách các sản phẩm mà chúng tôi sẽ tìm kiếm từ“ Bút ”. Lý lẽ A13đây là một liên kết đến một ô có văn bản mà chúng tôi sẽ tìm kiếm trong toàn bộ danh sách sản phẩm. Phạm vi ô “ B2: B10”Là một phạm vi có dữ liệu bán sản phẩm, trong đó hàm sẽ tìm“ Bút ”và tính giá trị trung bình.

Trong hầu hết các trường hợp, dữ liệu tập trung xung quanh một số điểm trung tâm. Vì vậy, để mô tả bất kỳ tập dữ liệu nào, chỉ cần chỉ ra giá trị trung bình là đủ. Hãy xem xét liên tiếp ba đặc điểm số được sử dụng để ước tính giá trị trung bình của phân phối: trung bình cộng, trung vị và chế độ.

Trung bình

Giá trị trung bình số học (thường được gọi đơn giản là giá trị trung bình) là ước tính phổ biến nhất về giá trị trung bình của một phân phối. Nó là kết quả của việc chia tổng của tất cả các giá trị số quan sát được cho số của chúng. Đối với một số mẫu X 1, X 2, ..., XN, trung bình của mẫu (được biểu thị bằng ký hiệu ) bằng \ u003d (X 1 + X 2 + ... + XN) / N, hoặc

trung bình của mẫu ở đâu, N- cỡ mẫu, Xtôi- phần tử thứ i của mẫu.

Tải xuống ghi chú ở định dạng hoặc, ví dụ ở định dạng

Xem xét tính toán trung bình số học của lợi nhuận trung bình hàng năm trong 5 năm của 15 quỹ tương hỗ có rủi ro rất cao (Hình 1).

Cơm. 1. Lợi tức trung bình hàng năm của 15 quỹ tương hỗ có rủi ro rất cao

Giá trị trung bình của mẫu được tính như sau:

Đây là một khoản lợi nhuận tốt, đặc biệt là khi so sánh với khoản lợi nhuận 3-4% mà những người gửi tiền ngân hàng hoặc công đoàn tín dụng nhận được trong cùng một khoảng thời gian. Nếu bạn sắp xếp các giá trị trả về, có thể dễ dàng thấy rằng tám quỹ có lợi tức trên và bảy - dưới mức trung bình. Giá trị trung bình số học hoạt động như một điểm cân bằng, để quỹ thu nhập thấp cân bằng quỹ thu nhập cao. Tất cả các phần tử của mẫu đều tham gia vào việc tính giá trị trung bình. Không có công cụ ước tính nào khác của phân phối có nghĩa là có thuộc tính này.

Khi nào cần tính trung bình cộng. Vì giá trị trung bình cộng phụ thuộc vào tất cả các phần tử của mẫu, nên sự hiện diện của các giá trị cực trị ảnh hưởng đáng kể đến kết quả. Trong những tình huống như vậy, giá trị trung bình số học có thể làm sai lệch ý nghĩa của dữ liệu số. Do đó, khi mô tả tập dữ liệu chứa các giá trị cực trị, cần chỉ ra trung vị hoặc trung bình cộng và trung vị. Ví dụ: nếu lợi nhuận của quỹ Tăng trưởng mới nổi RS bị loại bỏ khỏi mẫu, thì trung bình mẫu về lợi tức của 14 quỹ giảm gần 1% xuống còn 5,19%.

Trung bình

Trung vị là giá trị giữa của một mảng số có thứ tự. Nếu mảng không chứa các số lặp lại, thì một nửa số phần tử của nó sẽ nhỏ hơn và một nửa so với giá trị trung vị. Nếu mẫu chứa các giá trị cực trị, tốt hơn nên sử dụng giá trị trung bình hơn là giá trị trung bình số học để ước tính giá trị trung bình. Để tính giá trị trung bình của một mẫu, trước tiên nó phải được sắp xếp.

Công thức này không rõ ràng. Kết quả của nó phụ thuộc vào việc số đó là số chẵn hay lẻ. N:

Nếu mẫu chứa một số lẻ các mục, giá trị trung bình là (n + 1) / 2-thành phần.
Nếu mẫu chứa một số phần tử chẵn thì trung vị nằm giữa hai phần tử ở giữa của mẫu và bằng trung bình cộng được tính trên hai phần tử này.

Để tính giá trị trung bình cho một mẫu gồm 15 quỹ tương hỗ có rủi ro rất cao, trước tiên chúng ta cần sắp xếp dữ liệu thô (Hình 2). Khi đó trung vị sẽ đối diện với số phần tử ở giữa của mẫu; trong ví dụ số 8 của chúng tôi. Excel có một hàm đặc biệt = MEDIAN () cũng hoạt động với các mảng không có thứ tự.

Cơm. 2. Trung bình 15 quỹ

Như vậy, trung vị là 6,5. Điều này có nghĩa là một nửa số quỹ có rủi ro rất cao không vượt quá 6,5, trong khi nửa còn lại làm như vậy. Lưu ý rằng trung bình 6,5 lớn hơn một chút so với trung bình 6,08.

Nếu chúng ta loại bỏ khả năng sinh lời của quỹ Tăng trưởng mới nổi RS khỏi mẫu, thì mức trung bình của 14 quỹ còn lại sẽ giảm xuống còn 6,2%, tức là không đáng kể bằng trung bình cộng (Hình 3).

Cơm. 3. Quỹ trung bình 14

Thời trang

Thuật ngữ này được Pearson đưa ra lần đầu tiên vào năm 1894. Thời trang là con số xuất hiện thường xuyên nhất trong mẫu (thời trang nhất). Thời trang mô tả tốt, ví dụ, phản ứng điển hình của người lái xe đối với tín hiệu giao thông để dừng giao thông. Một ví dụ cổ điển về việc sử dụng thời trang là lựa chọn kích thước của lô giày được sản xuất hoặc màu sắc của giấy dán tường. Nếu một phân phối có nhiều chế độ, thì nó được cho là đa phương thức hoặc đa phương thức (có hai hoặc nhiều "đỉnh"). Phân phối đa phương thức cung cấp thông tin quan trọng về bản chất của biến số đang nghiên cứu. Ví dụ, trong các cuộc điều tra xã hội học, nếu một biến đại diện cho sở thích hoặc thái độ đối với điều gì đó, thì đa phương thức có thể có nghĩa là có một số ý kiến khác nhau rõ ràng. Đa phương thức cũng là một chỉ báo cho thấy mẫu không đồng nhất và các quan sát có thể được tạo ra bởi hai hoặc nhiều phân bố "chồng lên nhau". Không giống như giá trị trung bình số học, các giá trị ngoại lệ không ảnh hưởng đến chế độ. Đối với các biến ngẫu nhiên được phân phối liên tục, chẳng hạn như lợi nhuận trung bình hàng năm của các quỹ tương hỗ, chế độ này đôi khi hoàn toàn không tồn tại (hoặc không có ý nghĩa). Vì các chỉ số này có thể nhận nhiều giá trị khác nhau, nên các giá trị lặp lại là cực kỳ hiếm.

Tứ phân vị

Phần tư là các thước đo được sử dụng phổ biến nhất để đánh giá sự phân bố của dữ liệu khi mô tả các thuộc tính của các mẫu số lớn. Trong khi phần trung vị chia mảng có thứ tự thành một nửa (50% phần tử của mảng nhỏ hơn giá trị trung bình và 50% lớn hơn), các phần tư chia tập dữ liệu có thứ tự thành bốn phần. Giá trị Q 1, giá trị trung bình và Q 3 lần lượt là phân vị thứ 25, 50 và 75. Phần tư đầu tiên Q 1 là số chia mẫu thành hai phần: 25% các phần tử nhỏ hơn và 75% nhiều hơn phần tư đầu tiên.

Phần tư thứ ba Q 3 là một số chia mẫu thành hai phần: 75% nguyên tố nhỏ hơn và 25% nhiều hơn phần tư thứ ba.

Để tính toán phần tư trong các phiên bản Excel trước năm 2007, hàm = QUARTILE (mảng, phần) đã được sử dụng. Bắt đầu với Excel 2010, hai hàm được áp dụng:

= QUARTILE.ON (mảng, một phần)
= QUARTILE.EXC (mảng, một phần)

Hai hàm này cho các giá trị hơi khác nhau (Hình 4). Ví dụ: khi tính toán phần tư cho một mẫu chứa dữ liệu về lợi tức trung bình hàng năm của 15 quỹ tương hỗ có rủi ro rất cao, Q 1 = 1,8 hoặc -0,7 cho QUARTILE.INC và QUARTILE.EXC, tương ứng. Nhân tiện, hàm QUARTILE được sử dụng trước đó tương ứng với hàm QUARTILE.ON hiện đại. Để tính toán các phần tư trong Excel bằng cách sử dụng các công thức trên, mảng dữ liệu có thể không được sắp xếp theo thứ tự.

Cơm. 4. Tính toán phần tư trong Excel

Hãy nhấn mạnh lại. Excel có thể tính toán phần tư cho đơn biến loạt rời rạc, chứa các giá trị của một biến ngẫu nhiên. Việc tính toán các phần tư cho phân phối dựa trên tần suất được đưa ra trong phần bên dưới.

ý nghĩa hình học

Không giống như trung bình số học, trung bình hình học đo lường mức độ thay đổi của một biến theo thời gian. Giá trị trung bình hình học là gốc N mức độ từ sản phẩm N giá trị (trong Excel, hàm = CUGEOM được sử dụng):

G= (X 1 * X 2 * ... * X n) 1 / n

Một tham số tương tự - trung bình hình học của tỷ suất sinh lợi - được xác định theo công thức:

G \ u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

ở đâu R i- tỷ lệ lợi nhuận tôi-khoảng thời gian thứ.

Ví dụ: giả sử khoản đầu tư ban đầu là 100.000 đô la. Vào cuối năm đầu tiên, nó giảm xuống còn 50.000 đô la và đến cuối năm thứ hai, nó thu hồi về 100.000 đô la ban đầu. Tỷ suất lợi nhuận trên khoản đầu tư này trong một hai- khoảng thời gian năm bằng 0, vì số tiền ban đầu và số tiền cuối cùng bằng nhau. Tuy nhiên, trung bình số học của tỷ suất sinh lợi hàng năm là = (-0,5 + 1) / 2 = 0,25 hoặc 25%, vì tỷ suất sinh lợi trong năm đầu tiên R 1 = (50.000 - 100.000) / 100.000 = -0,5, và trong lần thứ hai R 2 = (100.000 - 50.000) / 50.000 = 1. Đồng thời, trung bình hình học của tỷ suất sinh lợi trong hai năm là: G = [(1–0,5) * (1 + 1)] 1 / 2 - 1 = ½ - 1 = 1 - 1 = 0. Do đó, trung bình hình học phản ánh chính xác hơn sự thay đổi (chính xác hơn là không thay đổi) về khối lượng đầu tư trong hai năm so với trung bình số học.

Sự thật thú vị.Đầu tiên, trung bình hình học sẽ luôn nhỏ hơn trung bình cộng của các số giống nhau. Trừ trường hợp tất cả các số đã lấy đều bằng nhau. Thứ hai, sau khi xem xét các tính chất của một tam giác vuông, người ta có thể hiểu tại sao giá trị trung bình được gọi là hình học. Chiều cao của một tam giác vuông, hạ xuống cạnh huyền, là tỷ lệ trung bình giữa hình chiếu của các chân trên cạnh huyền và mỗi chân là tỷ lệ trung bình giữa cạnh huyền và hình chiếu của nó trên cạnh huyền (Hình 5). Điều này cung cấp một cách hình học để xây dựng trung bình hình học của hai (độ dài) phân đoạn: bạn cần xây dựng một đường tròn trên tổng hai đoạn này là đường kính, sau đó là chiều cao, được khôi phục từ điểm nối của chúng đến giao điểm với vòng tròn, sẽ cho giá trị mong muốn:

Cơm. 5. Bản chất hình học của trung bình hình học (hình từ Wikipedia)

Thuộc tính quan trọng thứ hai của dữ liệu số là biến thểđặc trưng cho mức độ phân tán của dữ liệu. Hai mẫu khác nhau có thể khác nhau cả về giá trị trung bình và các biến thể. Tuy nhiên, như được hiển thị trong hình. 6 và 7, hai mẫu có thể có cùng độ thay đổi nhưng giá trị khác nhau, hoặc giá trị trung bình giống nhau và độ biến thiên hoàn toàn khác nhau. Dữ liệu tương ứng với đa giác B trong Hình. 7 thay đổi ít hơn nhiều so với dữ liệu mà từ đó đa giác A được tạo ra.

Cơm. 6. Hai phân bố hình chuông đối xứng có cùng độ chênh lệch và giá trị trung bình khác nhau

Cơm. 7. Hai phân bố hình chuông đối xứng có cùng giá trị trung bình và độ phân tán khác nhau

Có năm ước tính về sự thay đổi dữ liệu:

nhịp,
phạm vi liên phần,
phân tán,
độ lệch chuẩn,
hệ số biến thiên.

phạm vi

Phạm vi là sự khác biệt giữa các phần tử lớn nhất và nhỏ nhất của mẫu:

Vuốt = XMax-XMin

Phạm vi của một mẫu chứa dữ liệu về lợi nhuận trung bình hàng năm của 15 quỹ tương hỗ có rủi ro rất cao có thể được tính toán bằng cách sử dụng một mảng có thứ tự (xem Hình 4): range = 18,5 - (-6,1) = 24,6. Điều này có nghĩa là chênh lệch giữa lợi nhuận trung bình hàng năm cao nhất và thấp nhất đối với các quỹ rủi ro rất cao là 24,6%.

Phạm vi đo lường mức độ phổ biến tổng thể của dữ liệu. Mặc dù phạm vi mẫu là một ước tính rất đơn giản về tổng mức lan truyền dữ liệu, nhưng điểm yếu của nó là không tính đến chính xác cách dữ liệu được phân phối giữa các phần tử tối thiểu và tối đa. Hiệu ứng này được thấy rõ trong Hình. 8 minh họa các mẫu có cùng phạm vi. Thang đo B cho thấy rằng nếu mẫu chứa ít nhất một giá trị cực trị thì phạm vi mẫu là một ước tính rất không chính xác về mức độ phân tán của dữ liệu.

Cơm. 8. So sánh ba mẫu cùng dãy; hình tam giác tượng trưng cho giá đỡ của cán cân và vị trí của nó tương ứng với giá trị trung bình của mẫu

Phạm vi liên phần tư

Khoảng giữa phần tư, hoặc trung bình, là sự khác biệt giữa phần tư thứ ba và phần tư thứ nhất của mẫu:

Phạm vi liên phần tư \ u003d Q 3 - Q 1

Giá trị này giúp bạn có thể ước tính mức độ lan truyền của 50% các yếu tố và không tính đến ảnh hưởng của các yếu tố cực đoan. Phạm vi liên phần tư cho một mẫu chứa dữ liệu về lợi nhuận trung bình hàng năm của 15 quỹ tương hỗ có rủi ro rất cao có thể được tính toán bằng cách sử dụng dữ liệu trong Hình. 4 (ví dụ: đối với hàm QUARTILE.EXC): Phạm vi liên phần = 9,8 - (-0,7) = 10,5. Khoảng giữa 9,8 và -0,7 thường được gọi là nửa giữa.

Cần lưu ý rằng các giá trị Q 1 và Q 3, và do đó là phạm vi liên phần tư, không phụ thuộc vào sự hiện diện của các giá trị ngoại lệ, vì tính toán của chúng không tính đến bất kỳ giá trị nào nhỏ hơn Q 1 hoặc lớn hơn Q 3 . Tổng các đặc điểm định lượng, chẳng hạn như giá trị trung bình, phần tư thứ nhất và thứ ba, và phạm vi liên phần tư, không bị ảnh hưởng bởi các giá trị ngoại lai, được gọi là chỉ số mạnh mẽ.

Mặc dù phạm vi khoảng cách và phạm vi liên phần cung cấp ước tính tương ứng về tổng số và phân tán trung bình của mẫu, cả hai ước tính này đều không tính đến cách phân phối dữ liệu một cách chính xác. Phương sai và độ lệch chuẩn miễn khỏi thiếu sót này. Các chỉ số này cho phép bạn đánh giá mức độ biến động của dữ liệu xung quanh giá trị trung bình. Phương sai mẫu là một phép gần đúng của giá trị trung bình số học được tính toán từ sự khác biệt bình phương giữa mỗi phần tử mẫu và giá trị trung bình của mẫu. Đối với một mẫu X 1, X 2, ... X n thì phương sai mẫu (được ký hiệu bằng ký hiệu S 2 được cho bởi công thức sau:

Nói chung, phương sai mẫu là tổng bình phương chênh lệch giữa các phần tử mẫu và giá trị trung bình của mẫu, chia cho một giá trị bằng cỡ mẫu trừ đi một:

ở đâu - trung bình cộng, N- cỡ mẫu, X tôi - tôi-thành phần mẫu X. Trong Excel trước phiên bản 2007, hàm = VAR () được sử dụng để tính phương sai mẫu, kể từ phiên bản 2010, hàm = VAR.V () được sử dụng.

Ước tính thực tế nhất và được chấp nhận rộng rãi về phân tán dữ liệu là độ lệch chuẩn. Chỉ số này được ký hiệu bằng ký hiệu S và bằng căn bậc hai của phương sai mẫu:

Trong Excel trước phiên bản 2007, hàm = STDEV () được sử dụng để tính độ lệch chuẩn, từ phiên bản 2010, hàm = STDEV.B () được sử dụng. Để tính toán các hàm này, mảng dữ liệu có thể không có thứ tự.

Cả phương sai mẫu và độ lệch chuẩn mẫu đều không được âm. Tình huống duy nhất trong đó các chỉ số S 2 và S có thể bằng không là nếu tất cả các phần tử của mẫu đều bằng nhau. Trong trường hợp hoàn toàn không thể xảy ra này, phạm vi và phạm vi liên phần cũng bằng không.

Dữ liệu số vốn dễ bay hơi. Bất kỳ biến nào cũng có thể nhận nhiều giá trị khác nhau. Ví dụ, các quỹ tương hỗ khác nhau có tỷ lệ lãi và lỗ khác nhau. Do sự thay đổi của dữ liệu số, điều rất quan trọng là phải nghiên cứu không chỉ các ước tính về giá trị trung bình, về bản chất tổng hợp, mà còn cả các ước tính về phương sai, đặc trưng cho sự phân tán của dữ liệu.

Phương sai và độ lệch chuẩn cho phép chúng tôi ước tính mức độ trải rộng của dữ liệu xung quanh giá trị trung bình, nói cách khác, để xác định xem có bao nhiêu phần tử của mẫu nhỏ hơn giá trị trung bình và bao nhiêu phần tử lớn hơn. Sự phân tán có một số tính chất toán học có giá trị. Tuy nhiên, giá trị của nó là bình phương của một đơn vị đo lường - phần trăm vuông, đô la vuông, inch vuông, v.v. Do đó, ước tính tự nhiên của phương sai là độ lệch chuẩn, được biểu thị bằng các đơn vị đo lường thông thường - phần trăm thu nhập, đô la hoặc inch.

Độ lệch chuẩn cho phép bạn ước tính lượng biến động của các phần tử mẫu xung quanh giá trị trung bình. Trong hầu hết các tình huống, phần lớn các giá trị quan sát nằm trong khoảng cộng hoặc trừ một độ lệch chuẩn so với giá trị trung bình. Do đó, khi biết giá trị trung bình cộng của các phần tử mẫu và độ lệch chuẩn của mẫu, có thể xác định được khoảng mà phần lớn dữ liệu thuộc về.

Độ lệch chuẩn của lợi nhuận trên 15 quỹ tương hỗ có rủi ro rất cao là 6,6 (Hình 9). Điều này có nghĩa là lợi nhuận của phần lớn các quỹ khác với giá trị trung bình không quá 6,6% (nghĩa là nó dao động trong phạm vi từ - S= 6,2 - 6,6 = –0,4 đến + S= 12,8). Trên thực tế, khoảng thời gian này chứa lợi nhuận hàng năm trung bình trong 5 năm là 53,3% (8 trong số 15) quỹ.

Cơm. 9. Độ lệch chuẩn

Lưu ý rằng trong quá trình tính tổng các chênh lệch bình phương, các mục ở xa giá trị trung bình sẽ tăng trọng lượng hơn các mục ở gần hơn. Tính chất này là lý do chính tại sao giá trị trung bình số học thường được sử dụng nhất để ước tính giá trị trung bình của một phân phối.

Hệ số biến đổi

Không giống như các ước tính phân tán trước đây, hệ số biến thiên là một ước tính tương đối. Nó luôn được đo dưới dạng phần trăm, không phải trong các đơn vị dữ liệu gốc. Hệ số biến thiên, được biểu thị bằng các ký hiệu CV, đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình. Hệ số biến đổi bằng độ lệch chuẩn chia cho trung bình cộng và nhân với 100%:

ở đâu S- độ lệch mẫu chuẩn, - trung bình của mẫu.

Hệ số biến thiên cho phép bạn so sánh hai mẫu, các phần tử của chúng được biểu thị bằng các đơn vị đo lường khác nhau. Ví dụ, người quản lý của một dịch vụ chuyển phát thư có ý định nâng cấp đội xe tải. Khi tải các gói hàng, có hai loại hạn chế cần xem xét: trọng lượng (tính bằng pound) và thể tích (tính bằng feet khối) của mỗi gói hàng. Giả sử rằng trong một mẫu 200 bao, trọng lượng trung bình là 26,0 pound, độ lệch chuẩn của trọng lượng là 3,9 pound, thể tích gói trung bình là 8,8 feet khối và độ lệch chuẩn của thể tích là 2,2 feet khối. Làm thế nào để so sánh giữa trọng lượng và khối lượng của các gói hàng?

Vì các đơn vị đo trọng lượng và thể tích khác nhau, người quản lý phải so sánh mức chênh lệch tương đối của các giá trị này. Hệ số biến đổi trọng lượng là CV W = 3,9 / 26,0 * 100% = 15% và hệ số biến đổi thể tích CV V = 2,2 / 8,8 * 100% = 25%. Do đó, độ phân tán tương đối của khối lượng gói lớn hơn nhiều so với độ phân tán tương đối của trọng lượng của chúng.

Hình thức phân phối

Thuộc tính quan trọng thứ ba của mẫu là hình thức phân phối của nó. Sự phân bố này có thể đối xứng hoặc không đối xứng. Để mô tả hình dạng của một phân phối, cần phải tính giá trị trung bình và trung vị của nó. Nếu hai số đo này giống nhau, biến được cho là phân phối đối xứng. Nếu giá trị trung bình của một biến lớn hơn giá trị trung bình, thì phân phối của nó có độ lệch dương (Hình 10). Nếu giá trị trung vị lớn hơn giá trị trung bình, thì phân phối của biến số bị lệch âm. Độ lệch dương xảy ra khi giá trị trung bình tăng lên các giá trị cao bất thường. Độ lệch âm xảy ra khi giá trị trung bình giảm xuống các giá trị nhỏ bất thường. Một biến được phân phối đối xứng nếu nó không nhận bất kỳ giá trị cực trị nào theo cả hai hướng, sao cho các giá trị lớn và nhỏ của biến triệt tiêu lẫn nhau.

Cơm. 10. Ba loại phân phối

Dữ liệu được mô tả trên thang điểm A có độ lệch âm. Hình này cho thấy một đuôi dài và lệch trái gây ra bởi các giá trị nhỏ bất thường. Những giá trị cực kỳ nhỏ này sẽ chuyển giá trị trung bình sang trái và nó trở nên nhỏ hơn giá trị trung bình. Dữ liệu được hiển thị trên thang đo B được phân phối đối xứng. Nửa bên trái và bên phải của sự phân bố là hình ảnh phản chiếu của chúng. Các giá trị lớn và nhỏ cân bằng lẫn nhau, giá trị trung bình và giá trị trung vị bằng nhau. Dữ liệu được hiển thị trên thang đo B có độ lệch dương. Hình này cho thấy một cái đuôi dài và lệch sang bên phải, gây ra bởi sự hiện diện của các giá trị cao bất thường. Các giá trị quá lớn này sẽ chuyển giá trị trung bình sang phải và nó trở nên lớn hơn giá trị trung bình.

Trong Excel, thống kê mô tả có thể được lấy bằng cách sử dụng bổ trợ Gói phân tích. Xem qua menu Dữ liệu → Phân tích dữ liệu, trong cửa sổ mở ra, hãy chọn dòng Thống kê mô tả và bấm vào Được. Trong cửa sổ Thống kê mô tả hãy chắc chắn để chỉ ra khoảng thời gian đầu vào(Hình 11). Nếu bạn muốn xem thống kê mô tả trên cùng một trang tính với dữ liệu gốc, hãy chọn nút radio khoảng thời gian đầu ra và chỉ định ô mà bạn muốn đặt góc trên bên trái của thống kê được hiển thị (trong ví dụ của chúng tôi là $ C $ 1). Nếu bạn muốn xuất dữ liệu sang trang tính mới hoặc sổ làm việc mới, chỉ cần chọn nút radio thích hợp. Chọn hộp bên cạnh Thống kê cuối cùng. Tùy ý, bạn cũng có thể chọn Cấp độ khó,thứ k nhỏ nhất vàlớn thứ k.

Nếu đặt cọc Dữ liệu trong khu vực Phân tích bạn không thấy biểu tượng Phân tích dữ liệu, trước tiên bạn phải cài đặt tiện ích bổ sung Gói phân tích(xem ví dụ,).

Cơm. 11. Thống kê mô tả về lợi nhuận trung bình hàng năm trong 5 năm của các quỹ có mức độ rủi ro rất cao, được tính toán bằng cách sử dụng tiện ích bổ sung Phân tích dữ liệu Chương trình Excel

Excel tính toán một số thống kê được thảo luận ở trên: trung bình, trung vị, chế độ, độ lệch chuẩn, phương sai, phạm vi ( khoảng thời gian), tối thiểu, tối đa và kích thước mẫu ( kiểm tra). Ngoài ra, Excel tính toán một số thống kê mới cho chúng tôi: lỗi chuẩn, kurtosis và độ lệch. lỗi tiêu chuẩn bằng độ lệch chuẩn chia cho căn bậc hai của kích thước mẫu. không đối xứngđặc trưng cho độ lệch khỏi tính đối xứng của phân bố và là một hàm phụ thuộc vào khối lập phương của sự khác biệt giữa các phần tử của mẫu và giá trị trung bình. Kurtosis là thước đo nồng độ tương đối của dữ liệu xung quanh giá trị trung bình so với các phần cuối của phân phối, và phụ thuộc vào sự khác biệt giữa mẫu và giá trị trung bình được nâng lên lũy thừa thứ tư.

Tính toán thống kê mô tả cho dân số chung

Giá trị trung bình, độ phân tán và hình dạng của phân bố được thảo luận ở trên là các đặc điểm dựa trên mẫu. Tuy nhiên, nếu tập dữ liệu chứa các phép đo bằng số của toàn bộ tổng thể, thì các tham số của nó có thể được tính toán. Các tham số này bao gồm giá trị trung bình, phương sai và độ lệch chuẩn của tổng thể.

Gia trị được ki vọng bằng tổng tất cả các giá trị của tổng thể chung chia cho thể tích của tổng thể chung:

ở đâu µ - gia trị được ki vọng, Xtôi- tôi-quan sát biến thứ X, N- khối lượng của dân số chung. Trong Excel, để tính kỳ vọng toán học, hàm tương tự được sử dụng như đối với giá trị trung bình số học: = AVERAGE ().

Phương sai dân số bằng tổng bình phương chênh lệch giữa các phần tử của tổng thể chung và chiếu. kỳ vọng chia cho quy mô dân số:

ở đâu σ2 là phương sai của tổng thể chung. Excel trước phiên bản 2007 sử dụng hàm = VAR () để tính phương sai tổng thể, bắt đầu với phiên bản 2010 = VAR.G ().

Độ lệch tiêu chuẩn dân số bằng căn bậc hai của phương sai tổng thể:

Excel trước phiên bản 2007 sử dụng = STDEV () để tính độ lệch chuẩn tổng thể, bắt đầu với phiên bản 2010 = STDEV.Y (). Lưu ý rằng các công thức cho phương sai tổng thể và độ lệch chuẩn khác với các công thức cho phương sai mẫu và độ lệch chuẩn. Khi tính toán thống kê mẫu S2 và S mẫu số của phân số là n - 1 và khi tính toán các tham số σ2 và σ - khối lượng của dân số chung N.

quy tắc ngón tay cái

Trong hầu hết các tình huống, một tỷ lệ lớn các quan sát tập trung xung quanh dải phân cách, tạo thành một cụm. Trong các tập dữ liệu có độ lệch dương, cụm này nằm ở bên trái (tức là bên dưới) kỳ vọng toán học và trong các bộ có độ lệch âm, cụm này nằm ở bên phải (tức là ở trên) của kỳ vọng toán học. Dữ liệu đối xứng có cùng giá trị trung bình và trung vị, và các quan sát tập hợp xung quanh giá trị trung bình, tạo thành một phân bố hình chuông. Nếu phân phối không có độ lệch rõ rệt và dữ liệu tập trung xung quanh một trọng tâm nhất định, thì một quy tắc ngón tay cái có thể được sử dụng để ước tính độ biến thiên, cho biết: nếu dữ liệu có phân bố hình chuông, thì khoảng 68%. của các quan sát nằm trong một độ lệch chuẩn của kỳ vọng toán học, Khoảng 95% số quan sát nằm trong hai độ lệch chuẩn của giá trị kỳ vọng và 99,7% số quan sát nằm trong độ lệch chuẩn của giá trị kỳ vọng ba.

Do đó, độ lệch chuẩn, là ước tính của dao động trung bình xung quanh kỳ vọng toán học, giúp hiểu cách các quan sát được phân phối và xác định các giá trị ngoại lai. Nó tuân theo quy tắc ngón tay cái rằng đối với phân bố hình chuông, chỉ có một giá trị trong hai mươi khác với kỳ vọng toán học hơn hai độ lệch chuẩn. Do đó, các giá trị bên ngoài khoảng µ ± 2σ, có thể được coi là ngoại lệ. Ngoài ra, chỉ có ba trong số 1000 quan sát khác với kỳ vọng toán học hơn ba độ lệch chuẩn. Do đó, các giá trị bên ngoài khoảng µ ± 3σ hầu như luôn luôn là ngoại lệ. Đối với các bản phân phối có độ lệch cao hoặc không có hình chuông, có thể áp dụng quy tắc ngón tay cái Biename-Chebyshev.

Hơn một trăm năm trước, các nhà toán học Bienamay và Chebyshev đã độc lập phát hiện ra một tính chất hữu ích của độ lệch chuẩn. Họ phát hiện ra rằng đối với bất kỳ tập dữ liệu nào, bất kể hình dạng của phân bố, tỷ lệ phần trăm quan sát nằm ở khoảng cách không vượt quá kđộ lệch chuẩn so với kỳ vọng toán học, không ít (1 – 1/ 2) * 100%.

Ví dụ, nếu k= 2, quy tắc Biename-Chebyshev tuyên bố rằng ít nhất (1 - (1/2) 2) x 100% = 75% các quan sát phải nằm trong khoảng µ ± 2σ. Quy tắc này đúng cho bất kỳ k vượt quá một. Quy tắc Biename-Chebyshev có bản chất rất chung và có giá trị đối với các phân phối thuộc bất kỳ loại nào. Nó chỉ ra số lượng quan sát tối thiểu, khoảng cách từ đó đến kỳ vọng toán học không vượt quá một giá trị nhất định. Tuy nhiên, nếu phân phối là hình chuông, quy tắc ngón tay cái ước tính chính xác hơn nồng độ của dữ liệu xung quanh giá trị trung bình.

Tính toán thống kê mô tả cho phân phối dựa trên tần suất

Nếu dữ liệu gốc không có sẵn, phân bố tần số sẽ trở thành nguồn thông tin duy nhất. Trong những tình huống như vậy, bạn có thể tính toán các giá trị gần đúng của các chỉ số định lượng của phân phối, chẳng hạn như giá trị trung bình số học, độ lệch chuẩn, phần tư.

Nếu dữ liệu mẫu được trình bày dưới dạng phân bố tần số, thì giá trị gần đúng của giá trị trung bình số học có thể được tính toán, giả sử rằng tất cả các giá trị trong mỗi lớp đều tập trung tại điểm giữa của lớp:

ở đâu - ý nghĩa mẫu, N- số lượng quan sát, hoặc cỡ mẫu, với- số lớp trong phân bố tần số, mj- điểm giữa j- hạng thứ, fj- tần số tương ứng với j-thứ hạng.

Để tính toán độ lệch chuẩn từ phân bố tần số, người ta cũng giả định rằng tất cả các giá trị trong mỗi lớp đều tập trung tại điểm giữa của lớp.

Để hiểu cách các phần tư của chuỗi được xác định dựa trên tần suất, chúng ta hãy xem xét tính toán phần tư thấp hơn dựa trên dữ liệu cho năm 2013 về phân bố dân số Nga theo thu nhập tiền mặt bình quân đầu người (Hình 12).

Cơm. 12. Tỷ lệ dân số của Nga với thu nhập tiền tệ bình quân đầu người bình quân mỗi tháng, rúp

Để tính toán phần tư đầu tiên của chuỗi biến thiên khoảng thời gian, bạn có thể sử dụng công thức:

trong đó Q1 là giá trị của phần tư đầu tiên, xQ1 là giới hạn dưới của khoảng chứa phần tư đầu tiên (khoảng được xác định theo tần suất tích lũy, khoảng đầu tiên vượt quá 25%); i là giá trị của khoảng thời gian; Σf là tổng các tần số của toàn bộ mẫu; có lẽ luôn luôn bằng 100%; SQ1–1 là tần số tích lũy của khoảng trước khoảng chứa phần tư thấp hơn; fQ1 là tần số của khoảng có chứa phần tư thấp hơn. Công thức cho phần tư thứ ba khác nhau ở mọi chỗ, thay vì Q1, bạn cần sử dụng Q3 và thay thế ¾ thay vì ¼.

Trong ví dụ của chúng tôi (Hình 12), phần tư thấp hơn nằm trong khoảng 7000,1 - 10.000, tần suất tích lũy là 26,4%. Giới hạn dưới của khoảng này là 7000 rúp, giá trị của khoảng là 3000 rúp, tần số tích lũy của khoảng trước khoảng chứa phần tư dưới là 13,4%, tần suất của khoảng chứa phần tư dưới là 13,0%. Do đó: Q1 \ u003d 7000 + 3000 * (¼ * 100 - 13,4) / 13 \ u003d 9677 rúp.

Cạm bẫy liên quan đến thống kê mô tả

Trong ghi chú này, chúng tôi đã xem xét cách mô tả một tập dữ liệu bằng cách sử dụng các số liệu thống kê khác nhau để ước tính giá trị trung bình, phân tán và phân phối của nó. Bước tiếp theo là phân tích và diễn giải dữ liệu. Cho đến nay, chúng tôi đã nghiên cứu các thuộc tính khách quan của dữ liệu, và bây giờ chúng tôi chuyển sang cách giải thích chủ quan của chúng. Hai sai lầm nằm ở sự chờ đợi của nhà nghiên cứu: đối tượng phân tích được chọn không chính xác và giải thích sai kết quả.

Một phân tích về hoạt động của 15 quỹ tương hỗ có rủi ro rất cao là khá thiếu khách quan. Ông đã dẫn đến những kết luận hoàn toàn khách quan: tất cả các quỹ tương hỗ đều có lợi nhuận khác nhau, chênh lệch lợi nhuận của quỹ dao động từ -6,1 đến 18,5 và lợi nhuận trung bình là 6,08. Tính khách quan của phân tích dữ liệu được đảm bảo bởi sự lựa chọn chính xác của tổng các chỉ tiêu định lượng của phân phối. Một số phương pháp để ước tính giá trị trung bình và độ phân tán của dữ liệu đã được xem xét, đồng thời chỉ ra những ưu và nhược điểm của chúng. Làm thế nào để chọn đúng số liệu thống kê cung cấp một phân tích khách quan và không thiên vị? Nếu phân phối dữ liệu hơi lệch, có nên chọn giá trị trung bình trên giá trị trung bình cộng không? Chỉ báo nào mô tả chính xác hơn sự lan truyền của dữ liệu: độ lệch chuẩn hay phạm vi? Có nên chỉ ra độ lệch dương của phân phối không?

Mặt khác, diễn giải dữ liệu là một quá trình chủ quan. Những người khác nhau đưa ra những kết luận khác nhau, giải thích những kết quả giống nhau. Mọi người đều có quan điểm riêng của họ. Có người coi tổng lợi nhuận trung bình hàng năm của 15 quỹ có mức rủi ro rất cao là tốt và khá hài lòng với thu nhập nhận được. Những người khác có thể nghĩ rằng những quỹ này có lợi nhuận quá thấp. Vì vậy, tính chủ quan cần được bù đắp bằng sự trung thực, trung lập và rõ ràng của các kết luận.

Vấn đề đạo đức

Phân tích dữ liệu có mối liên hệ chặt chẽ với các vấn đề đạo đức. Người ta nên phê phán thông tin được phổ biến bởi báo chí, đài phát thanh, truyền hình và Internet. Theo thời gian, bạn sẽ học cách hoài nghi không chỉ về kết quả mà còn về mục tiêu, đối tượng và tính khách quan của nghiên cứu. Chính trị gia nổi tiếng người Anh Benjamin Disraeli đã nói hay nhất: “Có ba loại dối trá: dối trá, dối trá chết tiệt và thống kê”.

Như đã nêu trong bản ghi chú, các vấn đề đạo đức nảy sinh khi lựa chọn các kết quả cần được trình bày trong báo cáo. Cả hai kết quả tích cực và tiêu cực nên được công bố. Ngoài ra, khi lập báo cáo hoặc báo cáo bằng văn bản, kết quả phải được trình bày một cách trung thực, trung thực và khách quan. Phân biệt giữa trình bày xấu và không trung thực. Để làm được điều này, cần phải xác định ý định của người nói. Đôi khi người nói bỏ qua thông tin quan trọng do thiếu hiểu biết, và đôi khi cố ý (ví dụ: nếu anh ta sử dụng trung bình số học để ước tính giá trị trung bình của dữ liệu bị sai lệch rõ ràng nhằm thu được kết quả mong muốn). Nó cũng không trung thực để loại bỏ các kết quả không tương ứng với quan điểm của nhà nghiên cứu.

Tài liệu từ cuốn sách Levin và cộng sự. Thống kê cho các nhà quản lý được sử dụng. - M.: Williams, 2004. - tr. 178–209

Hàm QUARTILE được giữ lại để căn chỉnh với các phiên bản Excel trước

Trong toán học, trung bình cộng của các số (hay đơn giản là trung bình cộng) là tổng của tất cả các số trong một tập hợp nhất định chia cho số của chúng. Đây là khái niệm khái quát và phổ biến nhất về giá trị trung bình. Như bạn đã hiểu, để tìm được, bạn cần tính tổng tất cả các số đã cho và chia kết quả cho số số hạng.

Trung bình cộng là gì?

Hãy xem một ví dụ.

ví dụ 1. Các số được cho là: 6, 7, 11. Bạn cần tìm giá trị trung bình của chúng.

Quyết định.

Đầu tiên, chúng ta hãy tìm tổng của tất cả các số đã cho.

Bây giờ chúng ta chia tổng kết quả cho số hạng. Vì chúng ta có ba số hạng tương ứng nên chúng ta sẽ chia hết cho ba.

Do đó, giá trị trung bình của 6, 7 và 11 là 8. Tại sao lại là 8? Có, bởi vì tổng của 6, 7 và 11 sẽ giống như ba số tám. Điều này được thấy rõ trong hình minh họa.

Giá trị trung bình phần nào gợi nhớ đến "sự liên kết" của một chuỗi số. Như bạn có thể thấy, đống bút chì đã trở thành một cấp.

Hãy xem xét một ví dụ khác để củng cố kiến thức đã đạt được.

Ví dụ 2 Các số được cho là: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Bạn cần tìm trung bình cộng của chúng.

Quyết định.

Chúng tôi tìm thấy tổng.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Chia cho số số hạng (trong trường hợp này là 15).

Do đó, giá trị trung bình của dãy số này là 22.

Bây giờ hãy xem xét các số âm. Hãy nhớ cách tổng hợp chúng. Ví dụ, bạn có hai số 1 và -4. Hãy tìm tổng của chúng.

1 + (-4) = 1 - 4 = -3

Biết được điều này, hãy xem xét một ví dụ khác.

Ví dụ 3 Tìm giá trị trung bình của dãy số: 3, -7, 5, 13, -2.

Quyết định.

Tìm tổng các số.

3 + (-7) + 5 + 13 + (-2) = 12

Vì có 5 số hạng nên ta chia tổng thu được cho 5.

Do đó, trung bình cộng của các số 3, -7, 5, 13, -2 là 2,4.

Trong thời đại công nghệ tiến bộ, việc sử dụng các chương trình máy tính để tìm giá trị trung bình thuận tiện hơn rất nhiều. Microsoft Office Excel là một trong số đó. Tìm giá trị trung bình trong Excel rất nhanh chóng và dễ dàng. Hơn nữa, chương trình này được bao gồm trong gói phần mềm từ Microsoft Office. Hãy xem xét một hướng dẫn ngắn gọn, giá trị bằng cách sử dụng chương trình này.

Để tính giá trị trung bình của một chuỗi số, bạn phải sử dụng hàm AVERAGE. Cú pháp cho hàm này là:
= Trung bình (đối số1, đối số2, ... đối số255)
trong đó đối số1, đối số2, ... đối số255 là số hoặc tham chiếu ô (ô có nghĩa là phạm vi và mảng).

Để làm rõ hơn, chúng ta hãy kiểm tra kiến thức đã đạt được.

Nhập các số 11, 12, 13, 14, 15, 16 vào ô C1 - C6.
Chọn ô C7 bằng cách nhấp vào ô đó. Trong ô này, chúng tôi sẽ hiển thị giá trị trung bình.
Nhấp vào tab "Công thức".
Chọn Chức năng khác> Thống kê để mở
Chọn AVERAGE. Sau đó, một hộp thoại sẽ mở ra.
Chọn và kéo các ô C1-C6 ở đó để đặt phạm vi trong hộp thoại.
Xác nhận hành động của bạn bằng nút "OK".
Nếu bạn đã làm đúng mọi thứ, trong ô C7, bạn sẽ có câu trả lời - 13,7. Khi bạn nhấp vào ô C7, hàm (= Average (C1: C6)) sẽ được hiển thị trên thanh công thức.

Rất hữu ích khi sử dụng chức năng này cho kế toán, hóa đơn hoặc khi bạn chỉ cần tìm giá trị trung bình của một dãy số rất dài. Vì vậy, nó thường được sử dụng trong các văn phòng, công ty lớn. Điều này cho phép bạn giữ các hồ sơ theo thứ tự và giúp bạn có thể nhanh chóng tính toán một số thứ (ví dụ: thu nhập trung bình mỗi tháng). Bạn cũng có thể sử dụng Excel để tìm giá trị trung bình của một hàm.

Một phát minh rất tiện lợi của thế giới máy tính là bảng tính. Bạn có thể nhập dữ liệu vào chúng, sắp xếp chúng đẹp mắt dưới dạng tài liệu theo sở thích của bạn (hoặc theo sở thích của các cơ quan chức năng).

Bạn có thể tạo một tài liệu như vậy một lần - trên thực tế, ngay lập tức cả một nhóm tài liệu, theo thuật ngữ Excel, được gọi là “sổ làm việc” (sổ làm việc tiếng Anh).

Cách Excel hoạt động

Sau đó, bạn chỉ cần thay đổi một vài số ban đầu khi thay đổi dữ liệu, và sau đó Excel sẽ thực hiện một số hành động cùng một lúc, số học và các hành động khác. Nó nằm trong tài liệu:

Để làm điều này, chương trình bảng tính (và Excel không phải là chương trình duy nhất) có một kho công cụ số học và các hàm tạo sẵn được thực hiện trên các chương trình đã được gỡ lỗi và khả thi. Chỉ cần chỉ ra trong bất kỳ ô nào khi chúng ta viết công thức, trong số các toán hạng khác, tên của hàm tương ứng và các đối số trong ngoặc với nó.

Rất nhiều tính năng và chúng được nhóm theo ứng dụng:

Để tổng quát hóa nhiều dữ liệu, có một tập hợp toàn bộ các chức năng thống kê. Lấy giá trị trung bình của một số dữ liệu có lẽ là điều đầu tiên một nhà thống kê nghĩ đến khi xem xét các con số.

Trung bình là gì?

Đây là khi một chuỗi số nhất định được lấy, hai giá trị được tính cho chúng - tổng số và tổng tổng của chúng, sau đó giá trị thứ hai được chia cho số thứ nhất. Sau đó, bạn nhận được một số, theo giá trị của nó, nằm ở đâu đó ở giữa hàng. Thậm chí có thể trùng với một số con số trong bộ truyện.

Chà, hãy giả sử rằng con số đó cực kỳ may mắn trong trường hợp này, nhưng thường thì trung bình cộng không những không giống với bất kỳ số nào trong chuỗi của nó, mà thậm chí, như người ta nói, "không leo vào bất kỳ cửa ải nào" trong trường hợp này hàng loạt. Ví dụ, số người trung bình sống trong các căn hộ của thành phố N-ska nào đó, có thể có 5.216 người. Nó như thế nào? 5 người sống và một phần phụ khác của 216 phần nghìn của một người trong số họ? Người biết sẽ chỉ nhếch mép: anh làm gì vậy! Đó là số liệu thống kê!

Các bảng thống kê (hay đơn giản là kế toán) có thể có hình dạng và kích thước hoàn toàn khác nhau. Trên thực tế, hình dạng là một hình chữ nhật, nhưng chúng rộng, hẹp, lặp lại (ví dụ, dữ liệu trong một tuần qua ngày), nằm rải rác trên các trang tính khác nhau của sổ làm việc - sổ làm việc.

Hoặc thậm chí trong các sách bài tập khác (nghĩa là trong sách, bằng tiếng Anh) và thậm chí trên các máy tính khác trong mạng cục bộ, hoặc thật đáng sợ khi phải nói rằng, ở những nơi khác trong thế giới da trắng của chúng ta, giờ đây được thống nhất bởi Internet toàn năng. Rất nhiều thông tin có thể được lấy từ các nguồn rất có uy tín trên Internet đã ở dạng hoàn thiện. Sau đó xử lý, phân tích, đi đến kết luận viết bài, luận văn ...

Thực tế là, ngày nay chúng ta chỉ cần tính giá trị trung bình trên một mảng dữ liệu đồng nhất nhất định bằng cách sử dụng phép màu chương trình bảng tính. Đồng nhất có nghĩa là dữ liệu về một số đối tượng giống nhau và có cùng đơn vị đo lường. Vì vậy, người ta không bao giờ tính tổng bằng các túi khoai tây, mà tính bằng kilobyte bằng rúp và kopecks.

Ví dụ về tìm kiếm trung bình

Hãy để chúng tôi có dữ liệu ban đầu được ghi trong một số ô. Thông thường, dữ liệu tổng quát hóa, hoặc dữ liệu thu được từ dữ liệu gốc, bằng cách nào đó được ghi lại ở đây.

Dữ liệu ban đầu nằm ở phía bên trái của bảng (ví dụ: một cột là số bộ phận do một công nhân A sản xuất, tương ứng với một dòng riêng biệt trong bảng và cột thứ hai là giá của một bộ phận) , cột cuối cùng ghi sản lượng tiền của công nhân A.

Trước đây, điều này được thực hiện với một máy tính, bây giờ bạn có thể giao một nhiệm vụ đơn giản như vậy cho một chương trình không bao giờ mắc lỗi.

Bảng đơn giản về thu nhập hàng ngày

Đây trong hình số tiền thu nhập và nó được tính cho mỗi nhân viên trong cột E bằng cách nhân số bộ phận (cột C) với giá của bộ phận (cột D).

Sau đó, anh ta thậm chí sẽ không thể đặt chân đến những vị trí khác của bảng, và anh ta sẽ không thể nhìn vào các công thức. Mặc dù tất nhiên, tất cả mọi người trong cửa hàng đó đều biết sản lượng của một công nhân chuyển thành tiền mà anh ta kiếm được trong một ngày như thế nào.

Tổng giá trị

Sau đó, tổng các giá trị thường được tính toán. Đây là những con số tổng hợp. trong toàn bộ hội thảo, địa điểm hoặc toàn bộ nhóm. Thông thường những số liệu này được một số sếp báo cáo cho những người khác - những sếp cấp trên.

Đây là cách bạn có thể tính toán số tiền trong các cột của dữ liệu nguồn và đồng thời trong cột dẫn xuất, tức là cột thu nhập

Ngay lập tức, tôi lưu ý rằng trong khi bảng Excel đang được tạo, không có biện pháp bảo vệ nào được thực hiện trong các ô. Nếu không, làm thế nào chúng ta sẽ tự vẽ tấm, nhập thiết kế, tô màu và nhập các công thức thông minh và chính xác? Vâng, khi mọi thứ đã sẵn sàng, trước khi đưa sổ làm việc này (tức là tệp bảng tính) làm việc với một người hoàn toàn khác, thì biện pháp bảo vệ sẽ được thực hiện. Vâng, chỉ từ hành động bất cẩn, để không vô tình làm hỏng công thức.

Còn bây giờ bàn tự tính toán trong công việc, trong phân xưởng sẽ bắt đầu cùng với những người còn lại trong xưởng làm việc chăm chỉ. Sau khi ngày lao động kết thúc, tất cả các bảng số liệu như vậy về công việc của xưởng (chứ không phải chỉ một trong số đó) được chuyển đến các cơ quan có thẩm quyền cấp cao, người sẽ tổng hợp các số liệu này vào ngày hôm sau và đưa ra một số kết luận.

Đây rồi, mức trung bình (nghĩa là - bằng tiếng Anh)

Trước hết nó là tính số bộ phận trung bình, được thực hiện cho mỗi nhân viên mỗi ngày, cũng như thu nhập trung bình mỗi ngày cho công nhân của cửa hàng (và sau đó cho nhà máy). Chúng tôi cũng sẽ làm điều này ở hàng cuối cùng, thấp nhất trong bảng của chúng tôi.

Như bạn thấy, bạn có thể sử dụng số tiền đã được tính ở dòng trước, chỉ cần chia chúng cho số nhân viên - 6 trong trường hợp này.

Trong các công thức, chia cho hằng số, hằng số, là một dạng không tốt. Điều gì sẽ xảy ra nếu một điều gì đó khác thường xảy ra ở đất nước chúng ta, và số lượng nhân viên trở nên ít hơn? Sau đó, bạn sẽ cần phải leo lên tất cả các công thức và thay đổi số bảy thành một số khác ở mọi nơi. Ví dụ: bạn có thể "đánh lừa" dấu hiệu như sau:

Thay vì một số cụ thể, hãy đặt vào công thức một liên kết đến ô A7, nơi có số thứ tự của nhân viên cuối cùng trong danh sách. Có nghĩa là, đây sẽ là số lượng nhân viên, có nghĩa là chúng tôi chia chính xác số tiền cho cột quan tâm cho chúng tôi cho một số và nhận được giá trị trung bình. Như bạn có thể thấy, số bộ phận trung bình là 73, cộng với phần phụ đáng kinh ngạc về số lượng (mặc dù không quan trọng), thường được loại bỏ bằng phương pháp làm tròn.

Làm tròn đến kopecks

Làm tròn là một hành động phổ biến khi trong các công thức, đặc biệt là các công thức kế toán, một số được chia cho một số khác. Hơn nữa, đây là một chủ đề riêng trong kế toán. Kế toán đã làm tròn một thời gian dài và cẩn thận: họ làm tròn ngay lập tức từng số thu được bằng cách chia cho kopecks.

Excel là một chương trình toán học. Cô ấy không sợ hãi về một xu nhỏ - phải làm gì với nó. Excel chỉ lưu trữ các số như chúng vốn có, với tất cả các vị trí thập phân. Và lặp đi lặp lại sẽ thực hiện các phép tính với những con số như vậy. Và, kết quả cuối cùng có thể làm tròn (nếu chúng ta đưa ra lệnh).

Chỉ có bộ phận kế toán sẽ nói rằng đây là một sai lầm. Bởi vì họ làm tròn mỗi nhận được số "quanh co" thành toàn rúp và kopecks. Và kết quả cuối cùng thường hơi khác so với kết quả của một chương trình không quan tâm đến tiền bạc.

Nhưng bây giờ tôi sẽ kể bí mật chính. Excel có thể tìm mức trung bình mà không cần chúng tôi, nó có một chức năng tích hợp cho việc này. Cô ấy chỉ cần xác định một loạt dữ liệu. Và sau đó chính cô ấy sẽ cộng lại, đếm chúng, rồi chính cô ấy sẽ chia số tiền theo số lượng. Và nó sẽ diễn ra chính xác như những gì chúng ta đã hiểu từng bước.

Để tìm hàm này, chúng tôi đã chèn vào ô E9, nơi đặt kết quả của nó - giá trị trung bình trong cột E, nhấp vào biểu tượng fx, nằm ở bên trái của thanh công thức.

Một bảng có tên "Trình hướng dẫn chức năng" sẽ mở ra. Đây là một hộp thoại nhiều bước như vậy (Wizard, bằng tiếng Anh), với sự trợ giúp của chương trình giúp xây dựng các công thức phức tạp. Và, lưu ý rằng trợ giúp đã bắt đầu: trong thanh công thức, chương trình đã định hướng dấu = cho chúng ta.
Bây giờ bạn có thể bình tĩnh, chương trình sẽ hướng dẫn chúng ta vượt qua tất cả các khó khăn (kể cả bằng tiếng Nga, thậm chí bằng tiếng Anh) và kết quả là công thức tính toán chính xác sẽ được xây dựng.

Trong cửa sổ phía trên (“Tìm kiếm một hàm:”) có ghi rằng chúng ta có thể tìm kiếm và tìm thấy ở đây. Đó là, ở đây bạn có thể viết “trung bình” và nhấp vào nút “Tìm” (Tìm, bằng tiếng Anh). Nhưng bạn có thể làm khác. Chúng tôi biết rằng đây là một hàm - thuộc phạm trù thống kê. Ở đây chúng ta sẽ tìm thấy danh mục này trong cửa sổ thứ hai. Và trong danh sách mở ra bên dưới, chúng ta sẽ tìm thấy chức năng "AVERAGE".

Đồng thời, chúng ta sẽ thấy nó tuyệt vời như thế nào nhiều chức năng trong danh mục thống kê, có 7 mức trung bình. Và đối với mỗi hàm, nếu bạn di chuyển con trỏ qua chúng, bên dưới bạn có thể thấy chú thích ngắn gọn cho hàm này. Và nếu bạn nhấp vào thấp hơn nữa, trên dòng chữ "Trợ giúp cho chức năng này", bạn có thể nhận được mô tả rất chi tiết về nó.

Và bây giờ chúng ta chỉ tính giá trị trung bình. Chúng tôi nhấp vào "OK" (đây là cách thể hiện sự đồng ý bằng tiếng Anh, mặc dù đúng hơn là bằng tiếng Mỹ) trên nút bên dưới.

Chương trình đã định hướng phần đầu của công thức, bây giờ bạn cần đặt phạm vi cho đối số đầu tiên. Chỉ cần chọn nó bằng chuột. Bấm OK và nhận kết quả. Trái thêm làm tròn ở đây, chúng tôi đã thực hiện trong ô C9 và tấm này đã sẵn sàng cho công việc hàng ngày.