search engine

s1

Search Engine คือ เครื่องมือในการค้นหาข้อมูลบนอินเตอร์เน็ต Search Engine ที่มีคนนิยมใช้มากที่สุด    ก็คือ Search Engine ที่ชื่อว่า Google.com ทั้ง ๆ ที่ให้บริการมาไม่นาน เพราะด้วยรูปแบบที่ใช้งานง่าย และรวดเร็วนั่นเอง แถมเป็นภาษาไทยด้วย ยิ่งถูกใจคนไทยเป็นอย่างยิ่ง

s2

         

      

       

           1. แบบอาศัยการเก็บข้อมูลเป็นหลัก (Crawler-Based Search Engine)  หลักการนี้เป็นการใช้เครื่องมือที่เรียกว่า Crawler-Based Search Engine เป็นเครื่องมือที่ทำการบันทึกและเก็บข้อมูลเป็นหลัก   ซึ่งเป็นประเภท Search Engine ที่ได้รับความนิยมมากที่สุดในปัจจุบัน ซึ่งการทำงานประเภทนี้ จะใช้โปรแกรมตัวเล็ก ๆ ที่เรียกว่า Web Crawler หรือ Spider หรือที่เรียกอีกอย่างว่า Search Engine Robots หรือที่เรียกสั้น ๆ ว่า บอท ในภาษาไทย www คือเครือข่ายใยแมงมุม ตัวโปรแกรมเล็ก ๆ ตัวนี้ก็คือแมงมุมนั่นเอง โดยเจ้าแมงมุมตัวนี้จะทำการไต่ไปยังเว็บไซต์ต่าง ๆ ทั่วโลกอินเตอร์เน็ต โดยอาศัยไต่ไปตาม URL ต่าง ๆ ที่มีการเชื่อมโยงอยู่ในแต่ละเพจ แล้วทำการ Spider กวาดข้อมูลที่จำเป็นต่าง ๆ (ขึ้นอยู่กับ Search Engine แต่ละที่ว่าต้องการเก็บรวบรวมข้อมูลอะไรบ้าง) แล้วเก็บลงฐานข้อมูล การใช้โปรแกรมกวาดข้อมูลแบบนี้ จึงทำให้ข้อมูลที่ได้มีความแม่นยำ  และสามารถเก็บรวบรวมข้อมูลได้เร็วมาก Search Engine ที่เป็นประเภทนี้ เช่น   Google , YahooMSNLiveSearchTechnorati (สำหรับblog)

           2. แบบสารบัญเว็บไซต์ (Web Directory หรือ Blog Directory) Search Engine ที่เป็นแบบนี้มีอยู่หลายเว็บไซต์ ที่ดังที่สุุดในเมืองไทย นั้นก็คือที่สารบัญเว็บของ Sanook.com  หรือ Truehits.com เป็นต้น  สิ่งที่เราจะสังเกตเห็นจาก Search Engine ประเภทนี้ก็คือ ลักษณะของการจัดเก็บข้อมูล ที่แสดงให้เราเห็นทั้งหมด ว่ามีเว็บอะไรบ้างอยู่ในฐานข้อมูล ซึ่งแตกต่างจากประเภทแรก ที่หากคุณไม่ค้นหาโดยใช้คำค้น หรือ Keyword แล้ว คุณจะมีทางทราบเลยว่ามีเว็บไซต์อะไรอยู่บ้าง และมีเว็บอยู่เท่าไหร่ แบบสารบัญเว็บไซต์ จะแสดงข้อมูล   ที่รวบรวมเว็บไซต์ที่มีทั้งหมดในฐานข้อมูล และจะแบ่งเป็นหมวดหมู่ และอาจจะมีหมวดหมู่ย่อย ซึ่งผู้ค้นหาข้อมูลสามารถคลิกเข้าไปดูได้   หลักการทำงานแบบนี้ จะอาศัยการเพิ่มข้อมูลจากเจ้าของเว็บไซต์ต่าง ๆ ที่ต้องการประชาสัมพันธ์เว็บ หรืออาจใช้เจ้าหน้าที่  ที่ดูแลส่วน Search Engine เป็นผู้หาข้อมูลเว็บไซต์มาเพิ่มในฐานข้อมูล ซึ่งข้อมูลในส่วนของสารบัญเว็บไซต์จะเน้นในด้านความถูกต้องของฐานข้อมูล ซึ่งข้อมูลเว็บไซต์ที่ถูกเพิ่มเข้ามาจะถูกตรวจสอบและแก้ไขจากผู้ดูแล

          3. แบบอ้างอิงในคำสั่ง (Meta Tag (Meta Search Engine )  Search Engine ประเภทนี้จะอาศัยข้อมูลใน Meta tag   ซึ่งเป็นส่วนของข้อมูลที่อยู่ในแท็ก HEAD ของภาษา HTML ซึ่งข้อมูลในส่วนนี้ จะเป็นส่วนที่ให้ข้อมูลกับ Search Engine Robots  ซึ่ง Search Engine ประเภทนี้ไม่มีฐานข้อมูลของตนเอง แต่จะอาศัยข้อมูลจาก Search Engine Index Server  ของที่อื่น ๆ ซึ่งข้อมูลจะมาจาก Server หลาย ๆ ที่ ดังนั้น  จึงมักได้ผลลัพธ์จากการค้นหาที่แม่นยำ

s3

การทำงานของ Search Engine นั้นจะทำงานก็ต่อเมื่อมีคนป้อนคำหรือที่เรียกว่า keyword ลงไปใน Search Engine นั้นๆ จากนั้น Search Engine ก็จะแสดงรายการผลลัพธ์ที่มันคิดว่าผู้ใช้น่าจะต้องการขึ้นมาครับ การใช้ search engine ที่ดีนั้นคือการค้นหาข้อมูล  ที่ตรงและถูกต้องตามที่เราต้องการ

ลักษณะของปัจจัยที่ใช้ค้นหาโดยหลัก ๆ จะมีดังนี้

1. การค้นหาจากชื่อของตำแหน่ง URL ในเว็บไซต์ต่าง ๆ การค้นหาจากคำที่มีอยู่ใน Title (ส่วนที่ Browser)ใช้แสดงชื่อของเว็บเพจอยู่ทางด้านซ้ายบนของหน้าต่างที่แสดง
2. การค้นหาจากคำสำคัญหรือคำสั่ง keyword (อยู่ใน tag คำสั่งใน html ที่มีชื่อว่า meta)
3. การค้นหาจากส่วนที่ใช้อธิบายหรือบอกลักษณะ site

ตัวอย่าง Search Engine ของไทย

ตัวอย่างของ search engine ของต่างประเทศ

ขอบคุณ http://akarathep2409.blogspot.com/2011/01/search-engine.html

Advertisements

โดเมนเนม

9099

ประเภทของ Domain Name แบ่งได้เป็น 2 ประเภท
1.โดเมน 2 ระดับ  ชื่อโดเมน . ประเภทของโดเมน
2.โดเมน 3 ระดับ  ชื่อโดเมน.ประเภทของโดเมน.ประเทศ

โดนเมนเนม 2 ระดับ จะประกอบด้วย   www . ชื่อโดเมน.ประเภทของโดเมน  เช่น http://www.b2ccreation.com ประเภทของโดเมน คือ คำย่อขององค์กร โดยประเภทขององค์กรที่พบบ่อย มีดังต่อไปนี้

.com คือ บริษัท หรือ องค์กรพาณิชย์
* .org คือ องค์กรเอกชนที่ไม่แสวงผลกำไร
* .net คือ องค์กรที่เป็นเกตเวย์ หรือ จุดเชื่อมต่อเครือข่าย
* .edu คือ สถาบันการศึกษา
* .gov คือ องค์กรของรัฐบาล
* .mil คือ องค์กรทางทหาร

โดนเมนเนม 3 ระดับ
จะประกอบด้วย www . ชื่อโดเมน . ประเภทของโดเมน . ประเทศ  เช่น http://www.nongkipit.ac.th, http://www.nectec.or.th, http://www.google.co.th
ประเภทขององค์กรที่พบบ่อยคือ
* .co คือ บริษัท หรือ องค์กรพาณิชย์
* .ac คือ สถาบันการศึกษา
* .go คือ องค์กรของรัฐบาล
* .net คือ องค์กรที่ให้บริการเครือข่าย
* .or คือ องค์กรเอกชนที่ไม่แสวงผลกำไร

ตัวย่อของประเทศที่ตั้งขององค์กร
* .th   คือ ประเทศไทย
* .cn  คือ ประเทศจีน
* .uk  คือ ประเทศอังกฤษ
* .jp   คือ ประเทศญี่ปุ่น
* .au  คือ ประเทศออสเตรเลีย –

บราวเซอร์

b b1 b2
Browser  คือเครื่องมือที่ช่วยให้คุณสามารถท่องเที่ยวไปในโลกอินเตอร์เน็ตได้อย่างไร้ขีดกั้นทางด้าน
พรมแดน นอกจากนี้ Browser ยังช่วยอำนวยความสะดวกในการเยี่ยมชมเว็บไซต์ต่างๆ ซึ่งในขณะนี้บริษัทผลิต
ซอฟแวร์ค่ายต่าง ๆ นับวัน จะทวีการแข่งขันกันในการผลิต Browser เพื่อสร้างความพึงพอใจให้แก่นักท่องเว็บ
ให้มากที่สุดหน้าตาของ browser แตกต่างกันไปตามแต่การออกแบบการใช้งานของแต่ละค่ายโปรแกรม
 โปรแกรม Browser ที่เป็นที่นิยมในปัจจุบัน ได้แก่ Internet Explorer, Mozilla FireFox, Google Chrome
เป็นต้น ในที่นี้จะอธิบายถึง Browserที่นิยมใช้งานในปัจจุบันอย่างคร่าว ๆ
Internet Explorere
เป็น Browser ที่มีสัญลักษณ์ไอคอนเป็นตัว e สีน้ำเงิน ซึ่งหลายท่านอาจจะรู้จักหรือคุ้นเคย
Browser ตัวนี้มากกว่าตัวอื่น ๆ เนื่องจาก Browser ตัวนี้ผลิตโดยบริษัท Microsoft ผู้ผลิตโอเอส
DOS, Windows ฯลฯ ดังนั้น Browserจะมีติดไปกับ Windows จึงทำ Browser ตัวนี้เป็นที่นิยมมากกว่าตัวอื่น ๆ
fMozilla FireFox
Mozilla FireFox หรือที่รู้จักกันในชื่อ FireFox พัฒนาโดยมูลนิธิมอซิลลาและอาสาสมัครอีกหลายร้อยคนปัจจุบันอยู่ใต้การดำเนินงานของบริษัทมอซิลลา ปัจจุบันไฟร์ฟอกซ์เป็นเว็บเบราว์เซอร์ที่นิยมอันดับ 2 รองจากอินเทอร์เน็ตเอกซ์พลอเรอร์
cGoogle Chrome
เป็น Browser แบบโอเพนซอร์ซ ที่พัฒนาโดยกูเกิล โครมมีให้ดาวน์โหลดเพื่อทดสอบใช้งานสำหรับวินโดวส์ และมีภาษาที่ให้ใช้ได้มากกว่า 50 ภาษารวมถึงภาษาไทย รุ่นสำหรับ แมคโอเอส และ ลินุกซ์ นั้นกำลังอยู่ระหว่างการพัฒนา ซึ่งจะเปิดให้ทดสอบในอนาคต

(เพิ่มเติม…)

โปรโตคอล


Protocol คืออะไร

คือข้อกำหนดซึ่งประกอบด้วยกฎต่าง ๆ สำหรับรูปแบบการสื่อสารเฉพาะรูปแบบใดรูปแบบหนึ่ง        เพื่อให้การติดต่อสื่อสารในระบบเครือข่าย ทำงานได้ด้วยกันทั้งระบบ คล้ายกับมนุษย์สามารถใช้        ภาษาอังกฤษเป็นภาษากลางในการสื่อสารถึงกันได้  (ข้อมูล:HTTP://Wikipedia)
ในด้านเทคโนโลยีสารสนเทศ โปรโตคอลเป็นกลุ่มพิเศษของกฎ สำหรับการสื่อสารที่จุดปลายของ การเชื่อมต่อของการติดต่อสื่อสาร ใช้เมื่อมีการส่งสัญญาณเข้าและออก โปรโตคอลมีหลายระดับ    ในการเชื่อมต่อสำหรับการสื่อสาร เช่น มีโปรโตคอลของฮาร์ดแวร์โทรศัพท์, มีโปรโตคอล ระหว่างจุดปลายในโปรแกรมการสื่อสารภายในเครื่องคอมพิวเตอร์หรือตำแหน่งที่ต่างกัน จุดปลายทั้งคู่จะได้รับการจำและสังเกต โปรโตคอลมักจะได้รับการกำหนดในมาตรฐานทางอุตสาหกรรม

โพรโทคอลที่สำคัญ

      เอชทีทีพี (Hyper Text Transfer Protocol: HTTP) คือโพรโตคอล ในระดับชั้นโปรแกรมประยุกต์เพื่อการแจกจ่ายและการทำงานร่วมกันกับสารสนเทศของสื่อประสมใช้สำหรับการรับทรัพยากรที่เชื่อมโยงกับภายนอก ซึ่งนำไปสู่การจัดตั้งเวิลด์ไวด์เว็บ                                                                 เอชทีที พีเป็นมาตรฐานในการร้องขอและการตอบรับระหว่างเครื่องบลูกข่ายกับเครื่องแม่ข่าย  ซึ่งเครื่องลูกข่ายคือผู้ใช้ปลายทาง (end-user) และเครื่องแม่ข่ายคือเว็บไซต์  เครื่องลูกข่ายจะสร้างการร้องขอเอชทีทีพีผ่านทางเว็บเบราว์เซอร์  เว็บครอว์เลอร์ หรือเครื่องมืออื่น ๆ ที่จัดว่าเป็น      ตัวแทนผู้ใช้ (user agent) ส่วนเครื่องแม่ข่ายที่ตอบรับ ซึ่งเก็บบันทึกหรือสร้างทรัพยากร (resource) อย่างเช่นไฟล์เอชทีเอ็มแอลหรือรูปภาพ จะเรียกว่า เครื่องให้บริการต้นทาง                                                    Post Office Protocol  หรือ พ็อป หรือเกณฑ์วิธีที่ทำการไปรษณีย์  เป็นโพรโตคอลมาตรฐาน บนอินเทอร์เน็ต ใช้ในการรับอีเมล์จากเซิร์ฟเวอร์ โดยทำงานอยู่บนชุดโพรโทคอล TCP/IP             ในปัจจุบันผู้ให้บริการอินเทอร์เน็ตทุกรายให้บริการอ่านอีเมลแบบ POP3                                                    POP3 เป็นการพัฒนาจากโพรโทคอลรุ่นก่อนหน้านี้ คือ POP1 และ POP2 ในปัจจุบัน                คำว่า POP หมายความถึง POP3                                                                                                                     เอฟทีพี หรือ เกณฑ์วิธีถ่ายโอนแฟ้ม  (FTP: File Transfer Protocol) เป็นโพรโทคอล  เครือข่ายชนิดหนึ่ง ใช้สำหรับแลกเปลี่ยนและจัดการไฟล์บนเครือข่าย ICP/IP  เช่น อินเทอร์เน็ต   FTTP ถูกสร้างขึ้นด้วยสถาปัตยกรรมแบบ ระบบรับ-ให้บริการ (client-server) และใช้การเชื่อมต่อสำหรับส่วนข้อมูลและส่วนควบคุมแยกกันระหว่างเครื่องลูกข่ายกับเครื่องแม่ข่าย โปรแกรมประยุกต์เอฟทีพีเริ่มแรกโต้ตอบกันด้วยเครื่องมือรายคำสั่ง สั่งการด้วยไวยากรณ์ที่เป็นมาตรฐาน แต่ก็มีการพัฒนาส่วนต่อประสานกราฟิกกับผู้ใช้ขึ้นมาสำหรับระบบปฏิบัติการ เดสก์ท็อปที่ใช้กันทุกวันนี้           เอฟทีพี ยังถูกใช้เป็นส่วนประกอบของโปรแกรมประยุกต์อื่นเพื่อส่งผ่านไฟล์โดยอัตโนมัติสำหรับ   การทำงานภายในโปรแกรม เราสามารถใช้เอฟทีพีผ่านทางการพิสูจน์ตัวจริงด้วยชื่อผู้ใช้และรหัสผ่าน หรือเข้าถึงด้วยผู้ใช้นิรนาม                                                                                                                            เลขที่อยู่ไอพี (IP address) หรือชื่ออื่น เช่น ที่อยู่ไอพี, หมายเลขไอพี, เลขไอพี, ไอพีแอดเดรส คือหมายเลขที่ใช้ในระบบเครือข่าย ที่ใช้โพรโทคอลอินเทอร์เน็ต (IP) คล้ายกับหมายเลขโทรศัพท์ ที่เครื่องคอมพิวเตอร์ เครื่องเราท์เตอร์ เครื่องแฟกซ์ จะมีหมายเลขเฉพาะตัวโดยใช้เลข   ฐานสอง จำนวน 32 บิต โดยการเขียนจะเขียนเป็นชุด 4 ชุด โดยแต่ละชุดจะใช้เลขฐานสอง       จำนวน 8 บิต ซึ่งโดยทั่วไปแล้ว ผู้คนส่วนใหญ่จะคุ้นเคยกับระบบเลขฐานสิบ จึงมักแสดงผลโดยการใช้เลขฐานสิบ จำนวน 4 ชุด ซึ่งแสดงถึงหมายเลขเฉพาะของเครื่องนั้น สำหรับการส่งข้อมูลภายใน  เครือข่าย แลน หรือ แวน หรือ อินเทอร์เน็ต โดยหมายเลขไอพีมีไว้เพื่อให้ผู้ส่งรู้ว่าเครื่องของผู้รับ    คือใคร และผู้รับสามารถรู้ได้ว่าผู้ส่งคือใคร

ตัวอย่างของหมายเลขไอพี ได้แก่ 207.142.131.236  ซึ่งเมื่อแปลงกลับมาในรูปแบบที่อ่านได้จะเรียกว่า โดเมนแอดเดรส ผ่านทาง ระบบการตั้งชื่อโดเมน (Domain Name System) ซึ่งหมายเลขนั้นหมายถึง  www.wikipedia.org                                                                                                                  ข่้อมูลเพิ่มเติม:http://th.wikipedia.org/wiki/

FTP คืออะไร

FTP(File Transfer Protocol) ถ้าแปลเป็นไทยโดยอ้างอิงจากวิกิพีเดียก็จะแปลว่า “เกณฑ์วิธีถ่ายโอนแฟ้ม” ก็คือโปรโตคอลของเครือข่ายชนิดหนึ่ง ซึ่งออกแบบให้มีความเหมาะสมในการรับส่งไฟล์ หรือแลกเปลี่ยนไฟล์ในเครือข่ายคอมพิวเตอร์ ถ้าจะอธิบายแบบบ้านๆและเอาเรื่องใกล้ๆมาเป็นตัวอย่างให้เห็นภาพได้ง่ายๆ ก็อย่างเช่น เมื่อเราจะทำเว็บไซต์ สิ่งหนึ่งที่จะต้องทำก็คือการอัพโหลดไฟล์ขึ้นเซิร์ฟเวอร์ ซึ่งจะต้องได้ใช้ FTP โดยผ่านโปรแกรม FTP เช่น Filezilla อย่างแน่นอน เอฟทีพีถูกสร้างขึ้นด้วยสถาปัตยกรรมแบบระบบรับ-ให้บริการ (client-server) การรับส่งไฟล์จึงจะต้องมีเครื่องคอมพิวเตอร์สองฝั่ง คือฝั่งเซิร์ฟเวอร์ และ ไคล์แอนท์ ตัวอย่างไฟล์ชนิดต่างๆ ที่เราเคยอัพโหลดขึ้นเซิร์ฟเวอร์ เช่น PHP , JPG , GIF , PNG และไฟล์ประเภทต่างๆ ก็ล้วนสามารถอัพโหลดได้ทั้งนั้น

  • สรุปคร่าว ๆ ก็คือ โปรโตคอล ที่เหมาะสมในการรับส่งไฟล์ เรามักจะใช้ FTP เพราะมี              ความเหมาะสมมากกว่า โปรโตคอลอื่นๆ ก็สามารถรับส่งไฟล์ได้เช่นเดียวกัน แต่จะไม่เหมาะสม เพราะออกแบบไม่คนละอย่าง เช่น http ที่เราเคยใช้เป็นประจำ ก็จะเหมาะสำหรับการเรียกดู    หน้าเว็บไซต์ เป็นต้น

แหล่งข้อมูล http://pongpat.janthai.com/ftp