National Academies Press: OpenBook

On Being a Scientist: Vietnamese Version (2021)

Chapter: The treatment of data

« Previous: Advising and mentoring
Suggested Citation:"The treatment of data." National Academy of Sciences, National Academy of Engineering, and Institute of Medicine. 2021. On Being a Scientist: Vietnamese Version. Washington, DC: The National Academies Press. doi: 10.17226/27084.
×
Page 19
Suggested Citation:"The treatment of data." National Academy of Sciences, National Academy of Engineering, and Institute of Medicine. 2021. On Being a Scientist: Vietnamese Version. Washington, DC: The National Academies Press. doi: 10.17226/27084.
×
Page 20
Suggested Citation:"The treatment of data." National Academy of Sciences, National Academy of Engineering, and Institute of Medicine. 2021. On Being a Scientist: Vietnamese Version. Washington, DC: The National Academies Press. doi: 10.17226/27084.
×
Page 21
Suggested Citation:"The treatment of data." National Academy of Sciences, National Academy of Engineering, and Institute of Medicine. 2021. On Being a Scientist: Vietnamese Version. Washington, DC: The National Academies Press. doi: 10.17226/27084.
×
Page 22
Suggested Citation:"The treatment of data." National Academy of Sciences, National Academy of Engineering, and Institute of Medicine. 2021. On Being a Scientist: Vietnamese Version. Washington, DC: The National Academies Press. doi: 10.17226/27084.
×
Page 23

Below is the uncorrected machine-read text of this chapter, intended to provide our own search engines and external engines with highly rich, chapter-representative searchable text of each book. Because it is UNCORRECTED material, please consider the following text as a useful but insufficient proxy for the authoritative book pages.

The treatment of data - Xử lý dữ liệu English version Bản dịch tiếng Việt In order to conduct research responsibly, graduate Để thực hành nghiên cứu có trách nhiệm, học viên sau đại students need to understand how to treat data học cần hiểu rõ cách xử lý dữ liệu chính xác. Năm 2002, các correctly. In 2002, the editors of the Journal of Cell biên tập viên của Tạp chí Sinh học Tế bào (Journal of Cell Biology began to test the images in all accepted Biology) đã bắt đầu kiểm tra hình ảnh5 trong tất cả bản thảo manu- scripts to see if they had been altered in ways được chấp nhận đăng để xem liệu chúng có bị chỉnh sửa dẫn that violated the journal’s guidelines. About a tới vi phạm các hướng dẫn của tạp chí6 hay không. Kết quả quarter of the papers had images that showed là có khoảng một phần tư số bài báo có hình ảnh đã qua evidence of inappropriate manipulation. The editors chỉnh sửa không phù hợp so với các hướng dẫn này. Các biên requested the original data for these papers, tập viên đã yêu cầu dữ liệu gốc từ tác giả, so sánh dữ liệu compared the original data with the submitted gốc với các hình ảnh đã nộp, và yêu cầu các hình ảnh phải images, and required that figures be remade to được làm lại để tuân thủ với các hướng dẫn. Trong khoảng accord with the guidelines. In about 1 percent of the 1% số bài báo, các biên tập viên đã tìm thấy bằng chứng của papers, the editors found evidence for what they các "hành vi gian lận" (fraudulent manipulation) gây ảnh termed “fraudulent manipulation” that affected hưởng đến các kết luận được rút ra trong bài báo, dẫn đến conclusions drawn in the paper, resulting in the việc bài báo bị từ chối đăng tải. papers’ rejection. Researchers who manipulate their data in ways that Việc các nhà nghiên cứu xử lý dữ liệu của họ theo cách đánh deceive others, even if the manipulation seems lừa người khác, ngay cả khi việc xử lý đó dường như không insignificant at the time, are violating both the basic ảnh hưởng đáng kể, nhưng cũng được xem là vi phạm các values and widely accepted professional standards giá trị cơ bản và tiêu chuẩn chuyên môn vốn đã được chấp of science. Researchers draw conclusions based on nhận rộng rãi trong giới khoa học. Các nhà nghiên cứu đưa their observations of nature. If data are altered to ra kết luận dựa trên những quan sát của họ về tự nhiên. Nếu present a case that is stronger than the data thay đổi dữ liệu theo hướng kết luận mong muốn, họ sẽ warrant, researchers fail to fulfill all three of the không đáp ứng được cả ba nhóm nghĩa vụ được mô tả ở obligations described at the beginning of this guide. phần đầu của quyển sách này. Họ đánh lừa đồng nghiệp của They mislead their colleagues and potentially mình và có thể gây cản trở sự tiến bộ trong nghiên cứu của impede progress in their field or research. They bản thân hoặc trong cả lĩnh vực nghiên cứu. Họ làm suy giảm undermine their own authority and trustworthiness quyền hạn và sự đáng tin của người làm nghiên cứu. Khi đó, as researchers. And they introduce information into những thông tin sai lệch họ đưa vào tài liệu khoa học có thể the scientific record that could cause harm to the gây ảnh hưởng xấu tới xã hội, ví dụ như khi xem nhẹ những broader society, as when the dangers of a medical nguy cơ trong điều trị y tế. treatment are understated. 5 Xem thêm: https://ukrio.org/resources/research-integrity-resources/academic-image-integrity/ 6 Ví dụ: https://www.nature.com/nature-portfolio/editorial-policies/image-integrity 19

This is particularly important in an age in which the Điều này đặc biệt quan trọng trong thời đại mà Internet cho Internet al- lows for an almost uncontrollably fast phép lan truyền thông tin nhanh chóng và rộng rãi đến đông and extensive spread of infor- mation to an đảo người xem một cách không kiểm soát. Do đó, dữ liệu sai increasingly broad audience. Misleading or lệch hoặc không chính xác có thể gây ra những hậu quả inaccurate data can thus have far-reaching and nghiêm trọng và khó lường, ở mức độ chưa từng thấy so với unpredictable consequences of a magnitude not trước khi có Internet và các công nghệ truyền thông hiện đại known before the Internet and other modern khác. communication technologies. Misleading data can arise from poor experimental Dữ liệu sai lệch có thể phát sinh từ thiết kế thí nghiệm không design or care- less measurements as well as from hợp lý, các phép đo bất cẩn hoặc do thao tác chưa đúng. improper manipulation. Over time, researchers Theo thời gian, các nhà nghiên cứu đã phát triển và liên tục have developed and have continually improved cải tiến các phương pháp và công cụ để giữ sự liêm chính methods and tools designed to maintain the trong nghiên cứu. Một số phương pháp và công cụ được sử integrity of research. Some of these methods and dụng trong các lĩnh vực nghiên cứu cụ thể, chẳng hạn như tools are used within specific fields of research, such kiểm tra sự khác biệt có ý nghĩa thống kê, thử nghiệm “mù as statistical tests of significance, double-blind trials, đôi”7 và diễn giải chính xác một câu hỏi hay vấn đề trong các and proper phrasing of questions on surveys. Others khảo sát. Ngoài ra, còn có các phương pháp và công cụ được apply across all research fields, such as describing to áp dụng trên tất cả các lĩnh vực nghiên cứu, chẳng hạn như others what one has done so that research data and mô tả lại cho người khác những gì được thực hiện, qua đó results can be verified and extended. dữ liệu và kết quả nghiên cứu có thể được xác minh và mở rộng. Because of the critical importance of methods, Phương pháp thí nghiệm đóng vai trò rất quan trọng, do đó scientific papers must include a description of the các bài báo khoa học cần phải mô tả chi tiết quy trình đã sử procedures used to produce the data, sufficient to dụng để tạo ra dữ liệu, điều này cho phép người phản biện permit reviewers and readers of a scientific paper to và người đọc đánh giá không chỉ tính hợp lệ của dữ liệu mà evaluate not only the validity of the data but also còn cả độ tin cậy của các phương pháp được sử dụng để thu the reliability of the methods used to derive those thập những dữ liệu đó. Nếu thông tin này không được cung data. If this information is not available, other cấp đầy đủ, các nhà nghiên cứu khác khó có thể chấp nhận researchers may be less likely to accept the data and các dữ liệu và kết luận rút ra từ chúng. Họ cũng không thể the conclusions drawn from them. They also may be lặp lại (reproduce8) chính xác các điều kiện mà dữ liệu được unable to reproduce accurately the conditions thu thập. under which the data were derived. 7 Thử nghiệm “mù đôi” (Double-Blind Study): Theo Từ điển của Trung tâm Ung thư Quốc gia (Mỹ), thử nghiệm “mù đôi” thường được sử dụng trong nghiên cứu lâm sàng, mà cả người tham gia và nhà nghiên cứu đều không biết những người tham gia thử nghiệm thuộc nhóm đối chứng hay nhóm thử thuốc/trị liệu, cho đến khi thử nghiệm kết thúc. Điều này giúp cho kết quả của nghiên cứu ít có khả năng bị sai lệch bởi các yếu tố không liên quan đến việc điều trị. 8 Trong đa số lĩnh vực, reproduce chỉ hành động lặp lại thí nghiệm của những người thực hiện khác nhau, tại các phòng thí nghiệm khác nhau, với nguồn mẫu giống/dữ liệu đầu vào giống với thí nghiệm gốc. Xem thêm tại: https://www.ncbi.nlm.nih.gov/books/NBK547546/ 20

The best methods will count for little if data are Dù sử dụng những phương pháp tốt nhất, nhưng nếu dữ liệu recorded incorrectly or haphazardly. The được ghi lại không chính xác hay không theo trật tự thì các requirements for data collection differ among phương pháp đó cũng không mang lại nhiều giá trị. Các yêu disciplines and research groups, but researchers đầu đối với việc thu thập dữ liệu có thể khác nhau giữa các have a fundamental obligation to create and lĩnh vực và nhóm nghiên cứu, nhưng các nhà nghiên cứu có maintain an accurate, accessible, and permanent nghĩa vụ cơ bản là tạo ra và duy trì việc ghi chép (record) record of what they have done in sufficient detail for chính xác, lưu giữ thông tin lâu dài và những người khác có others to check and replicate their work. Depending thể truy cập để kiểm tra và lặp lại (replicate9) công việc của on the field, this obligation may require entering họ khi cần. Tùy thuộc vào lĩnh vực, giao ước này có thể có data into bound notebooks with sequentially những yêu cầu cụ thể hơn, chẳng hạn như yêu cầu ghi nhận numbered pages using permanent ink, using a dữ liệu bằng mực vĩnh viễn (không thể tẩy xóa) vào sổ đóng computer application with secure data entry fields, gáy có đánh số trang, sử dụng phần mềm máy tính với các identifying when and where work was done, and trường nhập dữ liệu an toàn. Các bản ghi chép còn cần xác retaining data for specified lengths of time. In much định thời gian, địa điểm thực hiện thí nghiệm và lưu giữ các industrial research and in some academic research, các dữ liệu này trong khoảng thời gian cụ thể. Trong nhiều data notebooks need to be signed and dated by a nghiên cứu ở quy mô công nghiệp và trong một số nghiên witness on a daily basis. cứu học thuật, sổ ghi chép dữ liệu cần được nhân chứng ký tên và xác nhận thời gian thực hiện hàng ngày. Unfortunately, beginning researchers often receive Thật không may, các nhà nghiên cứu mới thường ít hoặc little or no formal training in recording, analyzing, không được đào tạo bài bản về cách ghi chép, phân tích, lưu storing, or sharing data. Regularly scheduled trữ hoặc chia sẻ dữ liệu. Do đó, các nhóm và các đơn vị meetings to discuss data issues and policies nghiên cứu cần tổ chức và duy trì một cách thường xuyên maintained by research groups and institutions can các cuộc họp để thảo luận về các vấn đề và quy chế liên quan establish clear expectations and responsibilities. đến dữ liệu, nhằm xác định rõ ràng các kỳ vọng và trách nhiệm khi làm nghiên cứu. The Selection of Data Chọn lựa dữ liệu Deborah, a third-year graduate student, and Deborah - nghiên cứu sinh năm thứ ba và Kamala - nghiên Kamala, a postdoc- toral fellow, have made a series cứu sinh sau tiến sĩ đã thực hiện một loạt các phép đo trên of measurements on a new experimental một vật liệu bán dẫn mới bằng cách sử dụng thử nghiệm semiconductor material using an expensive neutron neutron đắt tiền tại phòng thí nghiệm quốc gia. Khi họ trở lại test at a national laboratory. When they return to phòng thí nghiệm riêng của nhóm nghiên cứu và kiểm tra dữ their own laboratory and examine the data, a newly liệu, một giả thuyết mới dựa trên mô hình toán học đã được 9 Trong đa số lĩnh vực, replicate chỉ hành động lặp lại thí nghiệm nghiệm của những người thực hiện khác nhau, có thể thực hiện tại cùng hoặc khác phòng thí nghiệm gốc, với nguồn mẫu/dữ liệu đầu vào khác với thí nghiệm gốc. Xem thêm tại: https://www.ncbi.nlm.nih.gov/books/NBK547546/ 21

proposed mathematical explanation of the đề xuất nhằm dự đoán thuộc tính của vật liệu bán dẫn. Kết semiconductor’s behavior predicts results indicated quả dự đoán từ mô hình này là một đường cong. by a curve. During the measurements at the national Trong suốt quá trình thực nghiệm tại phòng thí nghiệm quốc laboratory, Deborah and Kamala observed electrical gia, Deborah và Kamala đã quan sát thấy các biến động về power fluctuations that they could not control or điện năng mà họ không thể kiểm soát hoặc dự đoán được và predict were affecting their detector. They suspect làm ảnh hưởng đến bộ phận đọc tín hiệu (detector). Họ nghi the fluctuations affected some of their ngờ những biến động đó đã ảnh hưởng đến kết quả của một measurements, but they don’t know which ones. số phép đo, nhưng họ không biết chính xác nguyên nhân. Khi When Deborah and Kamala begin to write up their Deborah và Kamala bắt đầu viết kết quả của họ để trình bày results to present at a lab meeting, which they know tại cuộc họp của phòng thí nghiệm, bước đầu tiên trong quá will be the first step in preparing a publication, trình chuẩn bị công bố. Kamala đề nghị bỏ hai điểm dữ liệu Kamala suggests dropping two anomalous data bất thường gần trục hoành ra khỏi biểu đồ. Dựa vào độ lệch points near the horizontal axis from the graph they giá trị của hai điểm này so với đường cong dự đoán, cô ấy are preparing. She says that due to their deviation cho rằng các giá trị bất thường này là do dao động điện năng from the theoretical curve, the low data points were trong quá trình thí nghiệm gây ra. Hơn nữa, độ lệch này còn obviously caused by the power fluctuations. nằm ngoài giá trị sai số mong đợi được tính dựa trên các Furthermore, the deviations were outside the điểm dữ liệu còn lại. expected error bars calculated for the remaining data points. Deborah is concerned that dropping the two points Deborah lo ngại rằng việc loại bỏ hai điểm dữ liệu có thể bị could be seen as manipulating the data. She and coi là chỉnh sửa dữ liệu. Cô và Kamala không thể chắc chắn Kamala could not be sure that any of their data điểm dữ liệu nào (nếu có) chịu ảnh hưởng bởi sự dao động points, if any, were affected by the power điện năng. Họ cũng không biết liệu dự đoán dựa trên lý fluctuations. They also did not know if the thuyết có hợp lệ không. Cô ấy muốn thực hiện một phân tích theoretical prediction was valid. She wants to do a riêng bao gồm tất cả các điểm dữ liệu và thảo luận vấn đề separate analysis that includes the points and này trong buổi họp. Nhưng Kamala nói rằng nếu họ đưa các discuss the issue in the lab meeting. But Kamala says điểm dữ liệu vào nội dung trình bày, những người khác sẽ that if they include the data points in their talk, nghĩ đây là vấn đề quan trọng và cần phải thảo luận trong others will think the issue important enough to nội dung bản thảo, điều này sẽ khiến bài báo khó được công discuss in a draft ‘paper, which will make it harder bố hơn. Thay vào đó, lúc này cô ấy và Deborah nên sử dụng to get the paper published. Instead, she and khả năng phán đoán chuyên môn của mình để loại bỏ 2 điểm Deborah should use their professional judgment to dữ liệu đó. drop the points now. 1. Những yếu tố nào Kamala và Deborah nên xem xét 1. What factors should Kamala and Deborah take trước khi quyết định cách trình bày dữ liệu từ thí nghiệm into account in deciding how to present the data của họ? from their experiment? 22

2. Should the new explanation predicting the results 2. Liệu cách giải thích mà họ đưa ra để dự đoán kết quả affect their deliberations? có ảnh hưởng đến quá trình suy xét của họ không? 3. Should a draft paper be prepared at this point? 3. Có nên chuẩn bị bản thảo của bài báo vào thời điểm này 4. If Deborah and Kamala can’t agree on how the không? data should be presented, should one of them 4. Nếu Deborah và Kamala không thể thống nhất về cách consider not being an author of the paper? trình bày dữ liệu, liệu một trong số họ có nên cân nhắc việc không trở thành tác giả của bài báo không? 23

Next: Mistakes and negligence »
On Being a Scientist: Vietnamese Version Get This Book
×
 On Being a Scientist: Vietnamese Version
MyNAP members save 10% online.
Login or Register to save!
Download Free PDF

READ FREE ONLINE

  1. ×

    Welcome to OpenBook!

    You're looking at OpenBook, NAP.edu's online reading room since 1999. Based on feedback from you, our users, we've made some improvements that make it easier than ever to read thousands of publications on our website.

    Do you want to take a quick tour of the OpenBook's features?

    No Thanks Take a Tour »
  2. ×

    Show this book's table of contents, where you can jump to any chapter by name.

    « Back Next »
  3. ×

    ...or use these buttons to go back to the previous chapter or skip to the next one.

    « Back Next »
  4. ×

    Jump up to the previous page or down to the next one. Also, you can type in a page number and press Enter to go directly to that page in the book.

    « Back Next »
  5. ×

    To search the entire text of this book, type in your search term here and press Enter.

    « Back Next »
  6. ×

    Share a link to this book page on your preferred social network or via email.

    « Back Next »
  7. ×

    View our suggested citation for this chapter.

    « Back Next »
  8. ×

    Ready to take your reading offline? Click here to buy this book in print or download it as a free PDF, if available.

    « Back Next »
Stay Connected!