Below is the uncorrected machine-read text of this chapter, intended to provide our own search engines and external engines with highly rich, chapter-representative searchable text of each book. Because it is UNCORRECTED material, please consider the following text as a useful but insufficient proxy for the authoritative book pages.
The treatment of data - Xá» lý dữ liá»u English version Bản dá»ch tiếng Viá»t In order to conduct research responsibly, graduate Äá» thá»±c hà nh nghiên cứu có trách nhiá»m, há»c viên sau Äại students need to understand how to treat data há»c cần hiá»u rõ cách xá» lý dữ liá»u chÃnh xác. NÄm 2002, các correctly. In 2002, the editors of the Journal of Cell biên táºp viên của Tạp chà Sinh há»c Tế bà o (Journal of Cell Biology began to test the images in all accepted Biology) Äã bắt Äầu kiá»m tra hình ảnh5 trong tất cả bản thảo manu- scripts to see if they had been altered in ways Äược chấp nháºn ÄÄng Äá» xem liá»u chúng có bá» chá»nh sá»a dẫn that violated the journalâs guidelines. About a tá»i vi phạm các hÆ°á»ng dẫn của tạp chÃ6 hay không. Kết quả quarter of the papers had images that showed là có khoảng má»t phần tÆ° sá» bà i báo có hình ảnh Äã qua evidence of inappropriate manipulation. The editors chá»nh sá»a không phù hợp so vá»i các hÆ°á»ng dẫn nà y. Các biên requested the original data for these papers, táºp viên Äã yêu cầu dữ liá»u gá»c từ tác giả, so sánh dữ liá»u compared the original data with the submitted gá»c vá»i các hình ảnh Äã ná»p, và yêu cầu các hình ảnh phải images, and required that figures be remade to Äược là m lại Äá» tuân thủ vá»i các hÆ°á»ng dẫn. Trong khoảng accord with the guidelines. In about 1 percent of the 1% sá» bà i báo, các biên táºp viên Äã tìm thấy bằng chứng của papers, the editors found evidence for what they các "hà nh vi gian láºn" (fraudulent manipulation) gây ảnh termed âfraudulent manipulationâ that affected hÆ°á»ng Äến các kết luáºn Äược rút ra trong bà i báo, dẫn Äến conclusions drawn in the paper, resulting in the viá»c bà i báo bá» từ chá»i ÄÄng tải. papersâ rejection. Researchers who manipulate their data in ways that Viá»c các nhà nghiên cứu xá» lý dữ liá»u của há» theo cách Äánh deceive others, even if the manipulation seems lừa ngÆ°á»i khác, ngay cả khi viá»c xá» lý Äó dÆ°á»ng nhÆ° không insignificant at the time, are violating both the basic ảnh hÆ°á»ng Äáng ká», nhÆ°ng cÅ©ng Äược xem là vi phạm các values and widely accepted professional standards giá trá» cÆ¡ bản và tiêu chuẩn chuyên môn vá»n Äã Äược chấp of science. Researchers draw conclusions based on nháºn rá»ng rãi trong giá»i khoa há»c. Các nhà nghiên cứu ÄÆ°a their observations of nature. If data are altered to ra kết luáºn dá»±a trên những quan sát của há» vá» tá»± nhiên. Nếu present a case that is stronger than the data thay Äá»i dữ liá»u theo hÆ°á»ng kết luáºn mong muá»n, há» sẽ warrant, researchers fail to fulfill all three of the không Äáp ứng Äược cả ba nhóm nghÄ©a vụ Äược mô tả á» obligations described at the beginning of this guide. phần Äầu của quyá»n sách nà y. Há» Äánh lừa Äá»ng nghiá»p của They mislead their colleagues and potentially mình và có thá» gây cản trá» sá»± tiến bá» trong nghiên cứu của impede progress in their field or research. They bản thân hoặc trong cả lÄ©nh vá»±c nghiên cứu. Há» là m suy giảm undermine their own authority and trustworthiness quyá»n hạn và sá»± Äáng tin của ngÆ°á»i là m nghiên cứu. Khi Äó, as researchers. And they introduce information into những thông tin sai lá»ch há» ÄÆ°a và o tà i liá»u khoa há»c có thá» the scientific record that could cause harm to the gây ảnh hÆ°á»ng xấu tá»i xã há»i, và dụ nhÆ° khi xem nhẹ những broader society, as when the dangers of a medical nguy cÆ¡ trong Äiá»u trá» y tế. treatment are understated. 5 Xem thêm: https://ukrio.org/resources/research-integrity-resources/academic-image-integrity/ 6 Và dụ: https://www.nature.com/nature-portfolio/editorial-policies/image-integrity 19
This is particularly important in an age in which the Äiá»u nà y Äặc biá»t quan trá»ng trong thá»i Äại mà Internet cho Internet al- lows for an almost uncontrollably fast phép lan truyá»n thông tin nhanh chóng và rá»ng rãi Äến Äông and extensive spread of infor- mation to an Äảo ngÆ°á»i xem má»t cách không kiá»m soát. Do Äó, dữ liá»u sai increasingly broad audience. Misleading or lá»ch hoặc không chÃnh xác có thá» gây ra những háºu quả inaccurate data can thus have far-reaching and nghiêm trá»ng và khó lÆ°á»ng, á» mức Äá» chÆ°a từng thấy so vá»i unpredictable consequences of a magnitude not trÆ°á»c khi có Internet và các công nghá» truyá»n thông hiá»n Äại known before the Internet and other modern khác. communication technologies. Misleading data can arise from poor experimental Dữ liá»u sai lá»ch có thá» phát sinh từ thiết kế thà nghiá»m không design or care- less measurements as well as from hợp lý, các phép Äo bất cẩn hoặc do thao tác chÆ°a Äúng. improper manipulation. Over time, researchers Theo thá»i gian, các nhà nghiên cứu Äã phát triá»n và liên tục have developed and have continually improved cải tiến các phÆ°Æ¡ng pháp và công cụ Äá» giữ sá»± liêm chÃnh methods and tools designed to maintain the trong nghiên cứu. Má»t sá» phÆ°Æ¡ng pháp và công cụ Äược sá» integrity of research. Some of these methods and dụng trong các lÄ©nh vá»±c nghiên cứu cụ thá», chẳng hạn nhÆ° tools are used within specific fields of research, such kiá»m tra sá»± khác biá»t có ý nghÄ©a thá»ng kê, thá» nghiá»m âmù as statistical tests of significance, double-blind trials, Äôiâ7 và diá» n giải chÃnh xác má»t câu há»i hay vấn Äá» trong các and proper phrasing of questions on surveys. Others khảo sát. Ngoà i ra, còn có các phÆ°Æ¡ng pháp và công cụ Äược apply across all research fields, such as describing to áp dụng trên tất cả các lÄ©nh vá»±c nghiên cứu, chẳng hạn nhÆ° others what one has done so that research data and mô tả lại cho ngÆ°á»i khác những gì Äược thá»±c hiá»n, qua Äó results can be verified and extended. dữ liá»u và kết quả nghiên cứu có thá» Äược xác minh và má» rá»ng. Because of the critical importance of methods, PhÆ°Æ¡ng pháp thà nghiá»m Äóng vai trò rất quan trá»ng, do Äó scientific papers must include a description of the các bà i báo khoa há»c cần phải mô tả chi tiết quy trình Äã sá» procedures used to produce the data, sufficient to dụng Äá» tạo ra dữ liá»u, Äiá»u nà y cho phép ngÆ°á»i phản biá»n permit reviewers and readers of a scientific paper to và ngÆ°á»i Äá»c Äánh giá không chá» tÃnh hợp lá» của dữ liá»u mà evaluate not only the validity of the data but also còn cả Äá» tin cáºy của các phÆ°Æ¡ng pháp Äược sá» dụng Äá» thu the reliability of the methods used to derive those tháºp những dữ liá»u Äó. Nếu thông tin nà y không Äược cung data. If this information is not available, other cấp Äầy Äủ, các nhà nghiên cứu khác khó có thá» chấp nháºn researchers may be less likely to accept the data and các dữ liá»u và kết luáºn rút ra từ chúng. Há» cÅ©ng không thá» the conclusions drawn from them. They also may be lặp lại (reproduce8) chÃnh xác các Äiá»u kiá»n mà dữ liá»u Äược unable to reproduce accurately the conditions thu tháºp. under which the data were derived. 7 Thá» nghiá»m âmù Äôiâ (Double-Blind Study): Theo Từ Äiá»n của Trung tâm Ung thÆ° Quá»c gia (Mỹ), thá» nghiá»m âmù Äôiâ thÆ°á»ng Äược sá» dụng trong nghiên cứu lâm sà ng, mà cả ngÆ°á»i tham gia và nhà nghiên cứu Äá»u không biết những ngÆ°á»i tham gia thá» nghiá»m thuá»c nhóm Äá»i chứng hay nhóm thá» thuá»c/trá» liá»u, cho Äến khi thá» nghiá»m kết thúc. Äiá»u nà y giúp cho kết quả của nghiên cứu Ãt có khả nÄng bá» sai lá»ch bá»i các yếu tá» không liên quan Äến viá»c Äiá»u trá». 8 Trong Äa sá» lÄ©nh vá»±c, reproduce chá» hà nh Äá»ng lặp lại thà nghiá»m của những ngÆ°á»i thá»±c hiá»n khác nhau, tại các phòng thà nghiá»m khác nhau, vá»i nguá»n mẫu giá»ng/dữ liá»u Äầu và o giá»ng vá»i thà nghiá»m gá»c. Xem thêm tại: https://www.ncbi.nlm.nih.gov/books/NBK547546/ 20
The best methods will count for little if data are Dù sá» dụng những phÆ°Æ¡ng pháp tá»t nhất, nhÆ°ng nếu dữ liá»u recorded incorrectly or haphazardly. The Äược ghi lại không chÃnh xác hay không theo tráºt tá»± thì các requirements for data collection differ among phÆ°Æ¡ng pháp Äó cÅ©ng không mang lại nhiá»u giá trá». Các yêu disciplines and research groups, but researchers Äầu Äá»i vá»i viá»c thu tháºp dữ liá»u có thá» khác nhau giữa các have a fundamental obligation to create and lÄ©nh vá»±c và nhóm nghiên cứu, nhÆ°ng các nhà nghiên cứu có maintain an accurate, accessible, and permanent nghÄ©a vụ cÆ¡ bản là tạo ra và duy trì viá»c ghi chép (record) record of what they have done in sufficient detail for chÃnh xác, lÆ°u giữ thông tin lâu dà i và những ngÆ°á»i khác có others to check and replicate their work. Depending thá» truy cáºp Äá» kiá»m tra và lặp lại (replicate9) công viá»c của on the field, this obligation may require entering há» khi cần. Tùy thuá»c và o lÄ©nh vá»±c, giao Æ°á»c nà y có thá» có data into bound notebooks with sequentially những yêu cầu cụ thá» hÆ¡n, chẳng hạn nhÆ° yêu cầu ghi nháºn numbered pages using permanent ink, using a dữ liá»u bằng má»±c vÄ©nh viá» n (không thá» tẩy xóa) và o sá» Äóng computer application with secure data entry fields, gáy có Äánh sá» trang, sá» dụng phần má»m máy tÃnh vá»i các identifying when and where work was done, and trÆ°á»ng nháºp dữ liá»u an toà n. Các bản ghi chép còn cần xác retaining data for specified lengths of time. In much Äá»nh thá»i gian, Äá»a Äiá»m thá»±c hiá»n thà nghiá»m và lÆ°u giữ các industrial research and in some academic research, các dữ liá»u nà y trong khoảng thá»i gian cụ thá». Trong nhiá»u data notebooks need to be signed and dated by a nghiên cứu á» quy mô công nghiá»p và trong má»t sá» nghiên witness on a daily basis. cứu há»c thuáºt, sá» ghi chép dữ liá»u cần Äược nhân chứng ký tên và xác nháºn thá»i gian thá»±c hiá»n hà ng ngà y. Unfortunately, beginning researchers often receive Tháºt không may, các nhà nghiên cứu má»i thÆ°á»ng Ãt hoặc little or no formal training in recording, analyzing, không Äược Äà o tạo bà i bản vá» cách ghi chép, phân tÃch, lÆ°u storing, or sharing data. Regularly scheduled trữ hoặc chia sẻ dữ liá»u. Do Äó, các nhóm và các ÄÆ¡n vá» meetings to discuss data issues and policies nghiên cứu cần tá» chức và duy trì má»t cách thÆ°á»ng xuyên maintained by research groups and institutions can các cuá»c há»p Äá» thảo luáºn vá» các vấn Äá» và quy chế liên quan establish clear expectations and responsibilities. Äến dữ liá»u, nhằm xác Äá»nh rõ rà ng các kỳ vá»ng và trách nhiá»m khi là m nghiên cứu. The Selection of Data Chá»n lá»±a dữ liá»u Deborah, a third-year graduate student, and Deborah - nghiên cứu sinh nÄm thứ ba và Kamala - nghiên Kamala, a postdoc- toral fellow, have made a series cứu sinh sau tiến sÄ© Äã thá»±c hiá»n má»t loạt các phép Äo trên of measurements on a new experimental má»t váºt liá»u bán dẫn má»i bằng cách sá» dụng thá» nghiá»m semiconductor material using an expensive neutron neutron Äắt tiá»n tại phòng thà nghiá»m quá»c gia. Khi há» trá» lại test at a national laboratory. When they return to phòng thà nghiá»m riêng của nhóm nghiên cứu và kiá»m tra dữ their own laboratory and examine the data, a newly liá»u, má»t giả thuyết má»i dá»±a trên mô hình toán há»c Äã Äược 9 Trong Äa sá» lÄ©nh vá»±c, replicate chá» hà nh Äá»ng lặp lại thà nghiá»m nghiá»m của những ngÆ°á»i thá»±c hiá»n khác nhau, có thá» thá»±c hiá»n tại cùng hoặc khác phòng thà nghiá»m gá»c, vá»i nguá»n mẫu/dữ liá»u Äầu và o khác vá»i thà nghiá»m gá»c. Xem thêm tại: https://www.ncbi.nlm.nih.gov/books/NBK547546/ 21
proposed mathematical explanation of the Äá» xuất nhằm dá»± Äoán thuá»c tÃnh của váºt liá»u bán dẫn. Kết semiconductorâs behavior predicts results indicated quả dá»± Äoán từ mô hình nà y là má»t ÄÆ°á»ng cong. by a curve. During the measurements at the national Trong suá»t quá trình thá»±c nghiá»m tại phòng thà nghiá»m quá»c laboratory, Deborah and Kamala observed electrical gia, Deborah và Kamala Äã quan sát thấy các biến Äá»ng vá» power fluctuations that they could not control or Äiá»n nÄng mà há» không thá» kiá»m soát hoặc dá»± Äoán Äược và predict were affecting their detector. They suspect là m ảnh hÆ°á»ng Äến bá» pháºn Äá»c tÃn hiá»u (detector). Há» nghi the fluctuations affected some of their ngá» những biến Äá»ng Äó Äã ảnh hÆ°á»ng Äến kết quả của má»t measurements, but they donât know which ones. sá» phép Äo, nhÆ°ng há» không biết chÃnh xác nguyên nhân. Khi When Deborah and Kamala begin to write up their Deborah và Kamala bắt Äầu viết kết quả của há» Äá» trình bà y results to present at a lab meeting, which they know tại cuá»c há»p của phòng thà nghiá»m, bÆ°á»c Äầu tiên trong quá will be the first step in preparing a publication, trình chuẩn bá» công bá». Kamala Äá» nghá» bá» hai Äiá»m dữ liá»u Kamala suggests dropping two anomalous data bất thÆ°á»ng gần trục hoà nh ra khá»i biá»u Äá». Dá»±a và o Äá» lá»ch points near the horizontal axis from the graph they giá trá» của hai Äiá»m nà y so vá»i ÄÆ°á»ng cong dá»± Äoán, cô ấy are preparing. She says that due to their deviation cho rằng các giá trá» bất thÆ°á»ng nà y là do dao Äá»ng Äiá»n nÄng from the theoretical curve, the low data points were trong quá trình thà nghiá»m gây ra. HÆ¡n nữa, Äá» lá»ch nà y còn obviously caused by the power fluctuations. nằm ngoà i giá trá» sai sá» mong Äợi Äược tÃnh dá»±a trên các Furthermore, the deviations were outside the Äiá»m dữ liá»u còn lại. expected error bars calculated for the remaining data points. Deborah is concerned that dropping the two points Deborah lo ngại rằng viá»c loại bá» hai Äiá»m dữ liá»u có thá» bá» could be seen as manipulating the data. She and coi là chá»nh sá»a dữ liá»u. Cô và Kamala không thá» chắc chắn Kamala could not be sure that any of their data Äiá»m dữ liá»u nà o (nếu có) chá»u ảnh hÆ°á»ng bá»i sá»± dao Äá»ng points, if any, were affected by the power Äiá»n nÄng. Há» cÅ©ng không biết liá»u dá»± Äoán dá»±a trên lý fluctuations. They also did not know if the thuyết có hợp lá» không. Cô ấy muá»n thá»±c hiá»n má»t phân tÃch theoretical prediction was valid. She wants to do a riêng bao gá»m tất cả các Äiá»m dữ liá»u và thảo luáºn vấn Äá» separate analysis that includes the points and nà y trong buá»i há»p. NhÆ°ng Kamala nói rằng nếu há» ÄÆ°a các discuss the issue in the lab meeting. But Kamala says Äiá»m dữ liá»u và o ná»i dung trình bà y, những ngÆ°á»i khác sẽ that if they include the data points in their talk, nghÄ© Äây là vấn Äá» quan trá»ng và cần phải thảo luáºn trong others will think the issue important enough to ná»i dung bản thảo, Äiá»u nà y sẽ khiến bà i báo khó Äược công discuss in a draft âpaper, which will make it harder bá» hÆ¡n. Thay và o Äó, lúc nà y cô ấy và Deborah nên sá» dụng to get the paper published. Instead, she and khả nÄng phán Äoán chuyên môn của mình Äá» loại bá» 2 Äiá»m Deborah should use their professional judgment to dữ liá»u Äó. drop the points now. 1. Những yếu tá» nà o Kamala và Deborah nên xem xét 1. What factors should Kamala and Deborah take trÆ°á»c khi quyết Äá»nh cách trình bà y dữ liá»u từ thà nghiá»m into account in deciding how to present the data của há»? from their experiment? 22
2. Should the new explanation predicting the results 2. Liá»u cách giải thÃch mà há» ÄÆ°a ra Äá» dá»± Äoán kết quả affect their deliberations? có ảnh hÆ°á»ng Äến quá trình suy xét của há» không? 3. Should a draft paper be prepared at this point? 3. Có nên chuẩn bá» bản thảo của bà i báo và o thá»i Äiá»m nà y 4. If Deborah and Kamala canât agree on how the không? data should be presented, should one of them 4. Nếu Deborah và Kamala không thá» thá»ng nhất vá» cách consider not being an author of the paper? trình bà y dữ liá»u, liá»u má»t trong sá» há» có nên cân nhắc viá»c không trá» thà nh tác giả của bà i báo không? 23