ETC

Google งัด PageRank มาปรับเทคนิคค้นหาภาพ

Google Images Search By PageRank Productหากใครที่ใช้ Search Engine เข้าประจำอย่าง Google เวลาที่เราจะค้นหารูปภาพ เราจะเห็นว่ารูปภาพที่ปรากฏเวลาที่เราทำการค้นหาจะมีมากมาย แต่ในเรื่องของการค้นที่ได้อย่างตรงเป้าหมายตามต้องการเป็นแน่นอน นั้นกลับมีจำกัด และมักไม่ได้ภาพที่เราต้องการปรากฏขึ้นมามากเท่าที่ควรจะปรากฏ

เป็น การยากที่จะ ค้นหารูปภาพด้วย คีย์เวิร์ด ใดแล้วได้ รูปที่ตรงตาม คีย์เวิร์ดนั้น  อาจจะเป็นเพราะ หลายปัจจัย อาธิเช่น คำอธิบายรูปภาพ บนเว็บไซต์ต่างๆ สำหรับรูปภาพนั้น การกระบวนการวิเคราะห์รูปภาพ อัลกอริทึ่ม(Algorithm) ของ Google ที่ทำการวิเคราะห์จะไม่สามารถประมวลผลรูปภาพ ในเรื่องของการยืดหยุ่น ของการค้นหารูปภาพ ทีละหลายๆรูป ได้

แต่หลังจากที่ผมได้ทำการอ่านและวิเคราะห์ เอกสาร ที่น่าสนใจฉบับหนึ่ง ที่เขียนด้วย Yushi Jing และ เจ้าหน้าที่ของ Google เอง Shumeet Baluja
ในเอกสารได้อธิบายกลไก ที่ทำหน้าที่ วิเคราะห์ ที่คล้ายคลึง วิธีในการประมวลผล ของการจัดอันดับหน้า  (Page Rank) มาใช้ ระหว่างการค้นหารูปภาพ

“เราได้ทำการคัดเลือกโดยใช้การแก้ปัญหาการจัดอันดับ (Rank) ของรูปภาพ ระบุโนด node บน Visual similarity กราฟ ซึ่งเป็นกราฟที่จะเสนอการก่อให้
เกิดกลไกในการวิเครสะห์โครงสร้างจุดเชื่อมโยง (link) ของรูปภาพ ผ่านกระบวนการคำนวณการจัดอันดับของหน้า Page Rank)  คิดเป็นตัวเลขน้ำหนัก
เพื่อทำการกำหนดลงในรูปภาพนั้น มาตรการนี้มีความสำคัญกับ การพิจารณารูปภาพ อย่างชัดเจน”

เอกสารที่ชื่อว่า PageRank for Product Image Search หรือ การใช้ การจัดอันดับหน้า (Page Rank) สำหรับการค้นหา รูปภาพผลิตภัณฑ์ เป็นการอนุมานว่า
ผู้ใช้งาน เครื่องมือค้นหา (Search Engine) จะมีโอกาสในการค้นหาและพบรูปภาพที่คล้ายกันมากขึ้น

ผลลัพธ์ของคำว่า หอไอเฟล ที่ได้ผลลัพธ์ อย่างมีประสิทธภาพ
ผลการค้นหาคำว่า Mc Donald แล้วได้ผลลัพธ์ ที่ แตกต่างไม่ชัดเจน

โดยการเปรียบรูปภาพ ให้เหมือน การจัดเก้บหน้าเอกสารเว็บเพจ และ หาความเป็นไปได้ของความคล้ายคลึงกัน ของรูปภาพจากการเชื่อมโยง
ซึ่ง ได้ทำการหาค่าประมาณของโอกาสที่ผู้ใช้งานเครื่องมือค้นหา กับ การประมาณการโดยการเข้าชม มาทำการวิเคราะห์ และ ตรวจสอบความคล้ายกันของภาพ
เอกสารได้เน้น ในเรื่องของการใช้คุณลักษณะที่แตกต่างกัน ขึ้นอยู่กับประเภทของรูปภาพ

ระบบได้ทำการทดสอบ ที่ การ Query รูปภาพ 2000 รูปยอดนิยม ที่คนใช้ค้นหามากที่สุดจาก Google Search Engine ในวันที่ 23 กรกฏาคม 2007
โดยการประยุค อัลกอริทึม (Algorithm) เน้นไปที่ 1000 ผลลัพทธ์ของรูปภาพผลิตภัณฑ์จากเครื่องมือค้นหาของ Google และ ตั้งผลลัพท์จากการคาดหวัง
พบว่าผู้ใช้ 83% ได้ผลลัพท์ที่ไม่เกี่ยวข้องอยู่ 10 ผลลัพท์ในหน้าแรก จากเฉลี่ยผลลัพท์ 2.83 ของเครื่องมือค้นหาของ Google ปัจจุบันไปถึง 0.47

การค้นหาภาพ โดยใช้การเปรียบเทียบ ความคล้ายคลึง ระหว่างภาพ

ตัวอย่างที่เห็นชัดของการค้นหาคือ การค้นหาภาพ “โมนาลิซ่า” (Monat Painting) ซึ่งเป็นภาพที่มีชื่อเสียง เมื่อทำการค้นหาเรายังจะได้ภาพใกล้เคียงที่มี คำอธิบายภาพว่า
“Monet Painting in His Garden at Argenteuil” by Renoir.(จิตรกรรมในสวนสวรรค์ของพระเจ้า Argenteuil ของ เลอร์นัวร์)

ในอัลกอริทึม (Algorithm) ที่ใช้ในการคำนวณและ จัดอันดับหน้า (Page Rank) ที่สร้างจุดเชื่อมโยงโดยผู้สร้างหน้าเว็บและรูปภาพ,

แต่ ผุ้เขียนเอกสารทั้งสองคนนี้ไม่เห็นด้วยแรกเริ่มเลยการค้นหาต้องขึ้นอยู่กับ วิธีการที่มนุษย์ต้องมีความรู้และสร้างเงื่อนไขของการเชื่อมโยงที่น่าจะ เกี่ยวข้องกับรูปภาพที่หน้าเว็บ ก่อนการค้นหา โดยเครื่องมือค้นหาจะทำการเข้าไปแสดงรูปภาพโดยตรงจากหน้าเว็บที่ถูกจัด อันดับก่อน ต่อมา จะทำการวิเคราะห์ภาพที่คล้ายกัน ใน Similality Graph จะทำการสร้างคุณสมบัติ ที่คล้ายกันของแต่ละภาพ ขึ้นมารูปภาพที่ปรากฏขึ้นมาในเครื่องมือค้นหา รูปที่ปรากฏก่อนจะเป็นรูปที่มีผลลัพธ์การจัดอันดับสูงกว่า รูปอื่นๆ

จุดเชื่อมโยงของความคล้ายคลึงระหว่างรูปภาพ ใน Similaity Graph
Similality Graph

ใน ตอนนี้ เอกสารที่กล่าวมาทั้งหมดเป็นแค่ การเริ่มต้นของการวิจัย และ ยังมีผลลัพธ์ที่คลุมเครือไม่ชัดเจนนักถ้าหากจะนำเครื่องมือค้นหาอย่าง Google จะนำไปทำการปรับปรุงระบบ
การค้นหารูปภาพให้เกิดผลลัพธ์ที่เหมาะสมในอนาคต

ในปี 2006 Google ได้ติดต่อกับ บ. Neven Vision ซึ่งเป้นบริษัทที่เน้นการ วิเคราะห์ รูปภาพ (Image Analysist) หรือ Image Processing โดยเฉพาะ ซึ่งทาง Neven Vision ได้สร้าง
เครื่อง มือที่มีคุณลักษณะใหม่ขึ้นมา สามารถที่จะเชื่อมโยง รูปภาพไป ยังที่มาของรูปภาพ เช่นหน้าเว็บเพจ หรือ ระบบอื่นๆ โดยใช้วิธีการตรวจสอบในหน้าเว็บไซต์ที่ทำการค้นหา
ที่เรียก Visual Search ชื่อ Riya เครื่องมือค้นหารูปภาพโดยเฉพาะ เป็นเครื่องมือที่น่าสนใจและ น่าจับตามองที่สุดของ Neven Vision ในขณะนี้

Riya Search Engine โดย Neven Vision

หมายเหตุครับ: หากเกิดข้อผิดพลาดในการทำความเข้าใจกับ บทความ ก็สามารถแย้งได้ใน Comment ด้านล่างนะครับ พร้อมจะปรับเปลี่ยนและปรับปรุงตลอด

ที่มา :
http://citeseer.ist.psu.edu
http://www.esprockets.com/papers/www2008-jing-baluja.pdf

Asst. Prof. Banyapon Poolsawas

อาจารย์ประจำสาขาวิชาการออกแบบเชิงโต้ตอบ และการพัฒนาเกม วิทยาลัยครีเอทีฟดีไซน์ & เอ็นเตอร์เทนเมนต์เทคโนโลยี มหาวิทยาลัยธุรกิจบัณฑิตย์ ผู้ก่อตั้ง บริษัท Daydev Co., Ltd, (เดย์เดฟ จำกัด)

Related Articles

Leave a Reply

Back to top button

Adblock Detected

เราตรวจพบว่าคุณใช้ Adblock บนบราวเซอร์ของคุณ,กรุณาปิดระบบ Adblock ก่อนเข้าอ่าน Content ของเรานะครับ, ถือว่าช่วยเหลือกัน