Duplicate data
Definition :
หลายอินสแตนซ์ของข้อมูลที่เหมือนกันหรือคล้ายกันมากภายในชุดข้อมูลหรือฐานข้อมูล และเป็นหนึ่งในปัญหาที่ใหญ่ที่สุดในคุณภาพของข้อมูล การทำซ้ำเกิดขึ้นเมื่อมีบันทึกที่เหมือนกันหรือเกือบเหมือนกัน ส่งผลให้เกิดการซ้ำซ้อนโดยไม่จำเป็น ข้อมูลที่ซ้ำกันอาจมีอยู่ในชุดข้อมูลเดียว หรือข้ามชุดข้อมูลหรือระบบต่างๆ
Source : plauti.com/Duplicate data
Meaning by |
ความหมาย |
ChatGPT |
การที่มีข้อมูลที่ซ้ำกันในชุดข้อมูลหนึ่ง ๆ ซึ่งอาจเกิดจากการบันทึกข้อมูลหลายครั้ง, การรวมชุดข้อมูลจากหลายแหล่ง, หรือข้อผิดพลาดในการประมวลผลข้อมูล ตัวอย่างเช่น การมีชื่อและข้อมูลลูกค้าคนเดียวกันอยู่หลายแถวในฐานข้อมูล |
Gemini |
ข้อมูลที่ซ้ำซ้อนซึ่งส่งผลเสียต่อคุณภาพของข้อมูล โดยทั่วไปหมายถึงการมีอยู่ของข้อมูลเดียวกันหรือข้อมูลที่คล้ายกันในหลายตำแหน่งภายในฐานข้อมูลหรือระบบจัดเก็บข้อมูล |
- My Summary
- เป็นข้อมูลที่มีความซ้ำซ้อนกัน เช่น มีข้อมูลที่เหมือนกันอยู่ในระบบฐานข้อมูลซึ่งอาจเกิดได้จากการเพิ่มข้อมูลเดิมลงในระบบโดยที่ยังไม่ได้ลบข้อมูลเก่าออก หรือ การรวบรวมข้อมูลจากแหล่งต่างๆแล้วมีข้อมูลที่เหมือนกัน
- Sample
- Ex : ฐานข้อมูลนักศึกษาของมหาวิทยาลัย
- เช่น ตารางนักศึกษา: มีคอลัมน์ต่างๆ เช่น รหัสนักศึกษา, ชื่อ-นามสกุล, คณะ, สาขา
- นักศึกษาชื่อ “พันธรัฐ” ได้ทำการย้ายคณะ แต่เจ้าหน้าที่บันทึกข้อมูลสร้างระเบียนใหม่ แทนที่จะแก้ไขระเบียนเดิมในฐานข้อมูล ทำให้เกิดการซ้ำซ้อนของข้อมูลขึ้นในระบบ
- Ex : ฐานข้อมูลสินค้าคงคลังของบริษัท
- เช่น ตารางสินค้า: มีคอลัมน์ต่างๆ เช่น รหัสสินค้า, ชื่อสินค้า, จำนวนคงเหลือ
- บริษัทมีสินค้าชนิดเดียวกัน แต่มีสองรหัสสินค้า เนื่องจากมีการนำเข้าสินค้าจากสองแหล่งที่มาในฐานข้อมูล จะมีข้อมูลของสินค้าชนิดเดียวกันสองรายการ แต่มีรหัสสินค้าที่แตกต่างกัน ทำให้เกิดข้อมูลซ้ำซ้อนขึ้น