Số đo tập trung – Phần 3: Trung vị (Median)

Tiếp theo loạt bài về số đo xu hướng tập trung, hôm nay tôi sẽ nói với các bạn về trung vị (median). Nếu bạn nào biết nhiều từ hán việt có lẽ sẽ hiểu ý nghĩa của từ “trung vị” ngay. Nó có nghĩa là VỊ TRÍ Ở GIỮA. Đó chính là bản chất của trung vị. Tuy nhiên nó nằm ở giữa là giữa cái gì? Câu trả lời đó là nằm giữa các phần tử ĐÃ ĐƯỢC SẮP XẾP.

Giả sử chúng ta có 5 phần tử sau khi sắp xếp là:

3, 4, 7, 9, 17 (more…)

Số đo tập trung – Phần 2: Các loại trung bình (Mean) khác

Số trung bình gia quyền (Weighted Mean)

Trung bình gia quyền hay còn gọi là trung bình có trọng số. Như ở ví dụ phần 1 chúng ta thấy 6 là số trung bình của 3 số 3, 7, 8. Tức là:

Tw = (3 x 1/3) + (7 x 1/3) + (8 x 1/3) = 6

Chúng ta có thể tạm kết luận rằng, ở ví dụ trên mỗi phần tử có trọng số là bằng 1/3. Vậy điều gì sẽ xảy ra nếu trọng số khác nhau trong từng phần tử. Giả sử 3 số trên có trọng số  lần lượt là 1/5, 2/5, 2/5. Lúc này trung bình gia quyền sẽ là:

Tw = (3 x 1/5) + (7 x 2/5) + (8 x 1/3) = 6.6 (more…)

Số đo tập trung – Phần 1: Trung bình (Mean)

Số đo tập trung (Measures of Central Value) là các số đo cơ bản để mô tả sự tập trung của dữ liệu. Các số đo này cơ bản nhưng rất quan trọng trong nhiều lĩnh vực đặc biệt là thống kê. Ở series này, tôi sẽ lần lượt giới thiệu về trung bình (mean), trung vị (median), tần số xuất hiện nhiều nhất trong mẫu (mode hoặc modal value).

Số trung bình (Mean)

Trung bình (mean hoặc average), trong toán học nó được biết đến với tên gọi trung bình cộng. Có lẽ đây là số đo khá đơn giản và quen thuộc với chúng ta.

Giả sử chúng ta có 3 số 3, 7, 8, vậy giá trị trung bình cộng của 3 số này là sẽ là (3+7+8)/3 = 6.

mean-3-7-8

Rất dễ đúng không? Vậy trong xử lý ảnh, liệu nó có thể được ứng dụng cụ thể? Trong xử lý ảnh, bản thân mean và các biến thể khác của nó được sử dụng khá phổ biến. Để hiểu chi tiết về nó trong xử lý ảnh, chúng ta sẽ thử ví dụ nhỏ như sau. Chúng ta sẽ có 1 ảnh bông hoa:

flower (more…)

Sửa lỗi khi triển khai code sử dụng framework CodeIgniter trên IIS

Nếu bạn đang có sẵn máy chủ windows và để tiết kiệm chi phí không mua thêm hosting, server Linux thì có thể triển khai tạm thời trên máy chủ windows dùng IIS. Tuy nhiên sẽ dính một số lỗi đặc biệt về Url writing khi triển khai PHP với framework CodeIgniter. Các lỗi phổ biến khi chạy lần đầu sẽ là lỗi 500, 404. Vậy cách khắc phục ra sao? (more…)

Cách tạo danh mục tham khảo trong MS Office Word

Có rất nhiều người không biết đến tính năng này của Office Word. Nó sử dụng đặc biệt hiệu quả khi bạn muốn thay đổi hiển thị định dạng reference theo những tiêu chuẩn khác nhau (thường do nhà các xuất bản quy định). Với những ai đã từng viết báo, conference cho mục đích công bố kết quả nghiên cứu hẳn sẽ rất rõ những điều này. Trong video này mình hướng dẫn các bạn các load 1 file định dạng từ bên ngoài vào trong bộ soạn thảo word, nhập các bài báo, conference hay book tham khảo và in ra danh mục. Ngoài ra nếu bạn nào muốn sử dụng nâng cao hơn thì có thể tham khảo thêm các phần mềm chuyên tạo danh mục như EndNote.

Video hướng dẫn cách in danh mục tham khảo trong Word 2010:

File định dạng theo tiêu chuẩn của nhà xuất bản IEEE:

IEEE Referencing cho Word 2007 + 2010

Big Data #20 – Các tài nguyên tham khảo – Cách bắt đầu với Big Data?

Quay trở lại với câu hỏi ban đầu khi tìm hiểu big data.

“Tôi muốn học về big data. Tôi có thể học nó ở đâu?”

Đây thật sự là 1 câu hỏi lớn và có rất nhiều tài nguyên để tìm hiểu về big data và khó khăn thật sự là lựa chọn 1 tài nguyên để học. Do đó tôi liệt kê ra đây một số nguồn tài nguyên quan trọng có liên quan đến big data. (more…)

Big Data #19 – Cách trở thành nhà khoa học về dữ liệu (data scientist) và học về khoa học dữ liệu

Data Scientist (nhà khoa học dữ liệu) là 1 từ mới, mọi người dường như muốn trở thành data scientist. Duyệt qua 1 vài chủ đề chính liên quan đến data scientist. Trước hết chúng ta sẽ hiểu daa scientist là gì?

Trong thế giới mới của big data, tôi thấy nhiều người muốn trở thành data scientist và có nhiều người đã tuyên bố họ là data scientist.

Data scientist là gì?

Data scientists là các chuyên gia (expert) những người hiểu các khía cạnh khác nhau của kinh doanh và biết chiến lượt dữ liệu nào để đạt được mục tiêu kinh doanh. Họ có 1 nền tảng vững chắc các thuật toán dữ liệu khác nhau, mô hình và phương pháp thống kê. (more…)

Big Data #18 – Cơ bản về phân tích dữ liệu lớn (big data)

Khi bạn có nhiều dữ liệu xung quan, điều đầu tiên cần nghĩ đến là gì?

“Tất cả dữ liệu có nghĩa là gì?”

Chính xác – tôi cũng có cùng suy nghĩ như vậy. Tôi luôn muốn biết tất cả dữ liệu có nghĩa là gì. Hầu hết các dự án big data đều được xây dựng để truy xuất các thông minh khác nhau mà tất cả dữ liệu chứa đựng. Lấy ví dụ Facebook. Khi tôi nhìn danh sách bạn bè của Facebook, tôi luôn muốn hỏi nhiều câu hỏi như: (more…)