KHOÁ HỌC PHÂN TÍCH DỮ LIỆU CƠ BẢN VỚI PHẦN MỀM R

Tôi khôn xiết hân hạnh ra mắt đến chúng ta một cuốn sách mới có tựa đề là “Mô hình hồi qui và tò mò khoa học” (có thể dịch sang tiếng Anh là “Regression models for discoveries“) bởi Nhà xuất bạn dạng TPHCM new xuất bản. Tôi tin rằng chúng ta sinh viên, phân tích sinh, nhà nghiên cứu khoa học đang tìm thấy ngơi nghỉ cuốn sách một số trong những ý tưởng cùng phương pháp bổ ích cho bài toán làm nhiều mẫu mã và nâng cao chất lượng nghiên cứu của những bạn.

Bạn đang xem: Khoá học phân tích dữ liệu cơ bản với phần mềm r

*

Đa số phần đông ai làm nghiên cứu và phân tích khoa học tập cũng đều nghe biết hay nghe qua quy mô hồi qui đường tính. Đó là một mô hình rất thịnh hành trong phân tích khoa học, và ý tưởng phát minh bắt mối cung cấp từ nỗ lực kỉ 19 khi nhà công nghệ trứ danh Francis Galton mong mỏi định lượng mối tương quan giữa chiều cao và yếu tố di truyền. Tính từ lúc đó mang đến nay, quy mô hồi qui đường tính sẽ được cải cách và phát triển và ứng dụng trong nhiều chuyên ngành khoa học. Vào cuốn sách này, các bạn đọc không chỉ học về quy mô hồi qui tuyến đường tính, mà còn giúp quen cùng với những mô hình hồi qui ít được đề cập trong số sách giáo khoa căn phiên bản như quy mô hồi qui logistic, hồi qui Cox, hồi qui nhị phân, hồi qui Poisson, v.v. Mỗi mô hình hồi qui phù hợp cho một trường hợp cụ thể, với biết qua những ý tưởng đằng sau của mỗi mô hình giúp cho vấn đề định lượng hoá những thắc mắc nghiên cứu tốt hơn.

Trong thời gian gần đây, phần nhiều thuật ngữ new như ‘data science‘ (khoa học tập dữ liệu), ‘machine learning‘ (máy hoá tế bào hình), ‘artificial intelligence‘ (trí năng nhân tạo), v.v. Lộ diện ngày càng dày đặc trong thế giới khoa học. Nhưng không nhiều người biết tốt ghi dấn rằng 1 phần lớn đằng sau các danh trường đoản cú ‘hào nhoáng’ đó là các mô hình hồi qui, lí thuyết và phương pháp thống kê học. Tuy nhiên, những cách tiếp cận vừa kể tạo nên ứng dụng của các mô hình hồi qui thêm phong phú. Vào sách này, một số mô hình hồi qui cũng rất được triển khai theo mô thức của machine learning, và bạn đọc sẽ gọi hơn về những khái niệm như calibrationdiscrimination.

Cuốn sách bao hàm 23 chương được phân thành 3 phần. Phần 1 bao gồm những vụ việc cơ phiên bản như qui phương pháp xác suất, hiển thị tài liệu (data visualization), kiểm định giả thuyết và ngôn từ R. Phần 2 bao gồm 11 chương liên quan đến mô hình hồi qui tuyến tính, trường đoản cú ý tưởng, giải pháp ước tính mang lại các mô hình hồi qui nhiều thức cùng hồi qui ‘robust’. Phần 3 là đa số chương viết về các quy mô hồi qui logistic, Cox, Poission, cùng phân tích sinh sống còn. Mỗi quy mô được minh hoạ bằng một dữ liệu nghiên cứu thực tế cùng những mã laptop (dùng ngôn từ R) để các bạn đọc có thể thực hành ngay. Một trong những phần quan trọng trong những chương là phía dẫn giải pháp diễn giải kết quả phân tích để độc giả cảm thừa nhận được ý nghĩa sâu sắc đằng sau của từng phương pháp.

Tôi vẫn chấp nhận cho rằng quy mô là một cách để ý đến (mà có fan gọi là ‘tư duy’) cùng đặt câu hỏi. Đó là những lưu ý đến về kiểm tra giả thuyết, về lượng giá những mối tương quan, với về dự báo tương lai. Ở lever định tính, bạn có thể suy nghĩ về câu hỏi có hay là không có mối liên quan. Ở cường độ định lượng, bọn họ quan tâm đến hơn cả độ tương quan là bao nhiêu. Ở nấc độ sâu xa hơn, chúng ta hỏi nút độ liên quan có độc lập với các yếu tố khác trong qui phương tiện tự nhiên. Các mô hình trình bày vào cuốn sách này giúp cho bạn đọc xem xét và đặt câu hỏi chuyên sâu hơn cách để ý đến đơn giản.

Xem thêm: Xem Phim Taxi Driver - 1976 (Tài Xế Taxi), Xem Phim Tài Xế Điên Khùng

Tiêu đề của cuốn sách là khám phá, với tôi nghĩ cần có đôi giải thuật thích. Tìm hiểu là niềm hân hoan của người làm khoa học. Demo tưởng tượng sau rất nhiều năm mải mê nghiên cứu, bạn tạo thành được một bộ dữ liệu với mặt hàng triệu thay đổi thể gen, cùng phát hiện nay được biến chuyển thể nào có tương quan đến tuổi thọ đề xuất nói là một tò mò có ý nghĩa. Để đi mang lại phát hiện tại đó, các quy mô hồi qui đã giúp cho mình sàng thanh lọc những bộc lộ từ tài liệu lớn. Các mô hình hồi qui không những là một phương tiện đi lại khám phá, hơn nữa một phương thức dự báo khôn xiết hữu hiệu. Vày đó, gọi được phần đông ý tưởng, và nắm rõ những tài năng liên quan đến mô hình hồi qui là 1 trong những nhu cầu luôn luôn phải có được trong nghiên cứu khoa học.

Tôi nghiệm ra rằng phương pháp học phương pháp mới giỏi nhứt là học tập từ các vấn đề thực tiễn qua gần như câu chuyện. Vị đó, cuốn sách này được biên soạn thảo theo phong thái kể chuyện. Những mẩu truyện được nói trong sách bao gồm câu chuyện về sự thành lập của ý tưởng phát minh tương quan liêu (correlation) và quy mô hồi qui tuyến tính, những mẩu chuyện đằng sau các công trình nghiên cứu và phân tích thú vị mà các quy mô hồi qui giúp giải đáp.

Đây là 1 trong những cuốn sách tôi đã tất cả ý soạn từ bỏ lâu, do qua hàng trăm chương trình hướng dẫn ở vn trong thời gian 20 năm qua tôi nhận ra nhu ước cho một cuốn sách thể nhiều loại này. Tuy vậy mãi đến khi đại dịch Covid-19 xảy ra, với tôi phải thao tác từ nhà, phải mới có thời hạn viết cuốn sách. Nhân dịp này tôi trân trọng cảm ơn tiến sỹ Trần tô Thạch (Viện phân tích Garvan, Úc) và ts Hà Tấn Đức (Bệnh viện Đa khoa tw Cần Thơ) đã giúp tôi thực hiện các chương trình tập huấn trong thời hạn qua. Tiến sỹ Thạch vẫn đọc bản thảo trước tiên và cho các góp ý để cải tiến cuốn sách. Tôi cũng cảm ơn biên tập viên La Lan (Nhà xuất phiên bản Tổng Hợp) đã chăm chỉ đọc, bình chọn từng bí quyết và dàn trang mang lại cuốn sách. Tuy nhiên, giả dụ sách tất cả sai sót, và tôi nghĩ chắc chắn rằng có, thì trách nhiệm ở đầu cuối là của tôi. Trường hợp tìm thấy không nên sót, chúng ta đọc rất có thể viết e-mail cho tôi nhằm lần sau tái phiên bản hoàn chỉnh hơn. Xin thành tâm cám ơn chúng ta trước.

Mỗi cuốn sách rất có thể ví von như là 1 trong những người chúng ta thầm lặng. Tôi mong ước cuốn sách “Mô hình hồi qui và tìm hiểu khoa học” là 1 trong những người các bạn khoa học lặng lẽ bên cạnh bạn và các phân tích của các bạn, giỏi nói theo Tiên điền tiên sinh, là mua vui cũng khá được một vài trống canh.