bbgun

โปรเจ็ก bbgun

วันอาทิตย์ที่ 12 กันยายน พ.ศ. 2553

ข่าวสารประจำสัปดาห์ที่9

ข้อผิดพลาดของ Google Book Search ในเชิงเมทาดาตา
ในขณะที่หลายฝ่ายกำลังวิจารณ์ข้อตกลงในเรื่อง Google Book มีงานเขียนใน The Chronicle ที่น่าสนใจชิ้นหนึ่ง เกี่ยวกับความผิดพลาดของการสร้างเมทาดาตา (metadata) อัตโนมัติของ Google Book โดย Geoffrey Nunberg จาก UC Berkeley
ในช่วงต้นของบทความ Nunberg ใช้เวลาอธิบายความเชื่อที่ว่า ไม่ว่าผลของการพิจารณาเรื่องข้อตกลงจะออกมาในรูปแบบไหน Google Book ก็จะกลายเป็นมหาอำนาจทางความรู้ไปอย่างไม่แทบจะต้องสงสัย ถึงกับบอกว่า "เป็นที่ประจักษ์แล้วว่า Google Book นั้นกำลังมุ่งสู่การเป็นห้องสมุดดิจิตอลที่ใหญ่ที่สุดในโลก ที่สำคัญไม่ยิ่งหย่อนไปกว่านั้นก็คือ เกือบจะแน่นอนแล้วว่าจะเป็นแห่งสุดท้ายด้วย"
แต่ด้วยการที่ Google เจริญเติบโตมาด้วย search engine, อัลกอริทึ่มการค้นคืน (retrieval algorithm), ข้อมูลเต็มรูป (full-text), และสารสนเทศในฐานะผลผลิตของการสื่อสาร จึงไม่ได้ให้ความสำคัญกับเมทาดาตามากนัก การขาดการดูแลเมทาดาตานี่เอง ก็ดูเหมือนจะเป็นมหันตภัยอันร้ายแรงสำหรับวงการวิชาการเลยทีเดียวเพราะฉะนั้นในฐานะผู้ใช้ ก็ต้องมีความระมัดระวังมากขึ้น ในการนำข้อมูลที่ได้จาก Google ไปใช้ และไม่ใช่เพียง Google Book หรือ Google Scholar เท่านั้น แต่ยังรวมไปถึงการค้นข้อมูลทางวิชาการจากเว็บไซต์โดยทั่วไป หรือผลิตภัณฑ์การค้นคืนของ search engine อื่น ๆ ด้วยเช่นกัน
อีกประเด็นหนึ่งที่น่าสนใจ และ Nunberg ได้เกริ่นไว้ในตอนท้าย ก็คือ Page Rank ที่ดูเหมือนเป็นสูตรสำคัญของ Google และทำให้ Google เป็นใหญ่ในยุทธจักร search engine นั้น ดูเหมือนว่าจะไม่สามารถตอบสนองคุณลักษณะเฉพาะของทรัพยากรประเภทหนังสือได้ เพราะผลการค้นของ Google Book ในปัจจุบัน ดูเหมือนว่ายังไม่เป็นที่พึงพอใจของทั้งผู้ใช้และบรรณารักษ์
Nunberg คาดหมายว่า เมื่อนำเอาข้อมูลจากห้องสมุดเข้าไปในระบบ ก็น่าจะทำให้การค้นคืนมีประสิทธิผลมากกว่านี้ นอกจากนี้ crowd sourcing ก็ดูเหมือนจะเป็นอีกช่องทางหนึ่งที่จะช่วยแก้ไขปัญหานี้ได้ ในความคิดของผู้เขียน หาก Google ร่วมมือกับ Amazon ก็น่าจะทรงพลังอย่างมหาศาล แต่ว่า Amazon นั้น ก็ประกาศตัวไปอยู่ฝั่งตรงข้ามเสียแล้ว แต่กระนั้นก็อย่าเพิ่งด่วนตัดสินใจ เพราะเมื่อสงครามยังไม่จบ (เพิ่งจะเริ่มต้นด้วยซ้ำ) ก็อย่านับศพทหาร นอกจากนี้ Google ยังสามารถหาพันธมิตรได้จากชุมชนอื่น ๆ อีกมาก แต่ปัญหาของ crowd sourcing ก็อยู่ที่ความไม่คงเส้นคงวา ความขัดแย้ง และสับสนในตัวเมทาดาตา
http://www.onopen.com/songphan/09-09-27/5044

ไม่มีความคิดเห็น:

แสดงความคิดเห็น