Search
Engine atau Mesin Pencari adalah program komputer yang dirancang untuk
melakukan pencarian atas berkas-berkas yang tersimpan dalam layanan www,
ftp, publikasi milis, ataupun news group dalam sebuah ataupun sejumlah
komputer peladendalam suatu jaringan. Search engine merupakan perangkat
pencari informasi dari dokumen-dokumen yang tersedia. Hasil pencarian
umumnya ditampilkan dalam bentuk daftar yang seringkali diurutkan
menurut tingkat akurasi ataupun rasio pengunjung atas suatu berkas yang
disebut sebagai hits. Informasi yang menjadi target pencarian bisa
terdapat dalam berbagai macam jenis berkas seperti halaman situs web,
gambar, ataupun jenis-jenis berkas lainnya. Beberapa mesin pencari juga
diketahui melakukan pengumpulan informasi atas data yang tersimpan dalam
suatu basisdata ataupun direktori web.
Sebagian besar mesin pencari dijalankan oleh perusahaan swasta yang
menggunakan algoritma kepemilikan dan basis data tertutup, di antaranya
yang paling populer adalah Google (MSN Search dan Yahoo!). Telah ada
beberapa upaya menciptakan mesin pencari dengan sumber terbuka (open
source), contohnya adalah Htdig, Nutch, Egothor dan OpenFTS.
Saat awal perkembangan internet, Tim Berners-Lee membuat sebuah situs
web yang berisikan daftar situs web yang ada di internet melalui peladen
web CERN. Sejarah yang mencatat sejak tahun 1992 masih ada hingga kini.
Dengan semakin banyaknya situs web yang aktif membuat daftar ini tidak
lagi memungkinkan untuk dikelola oleh manusia. Utilitas pencari yang
pertama kali digunakan untuk melakukan pencarian di internet adalah
Archie yang berasal dari kata "archive" tanpa menggunakan huruf "v".
Archie dibuat tahun 1990 oleh Alan Emtage, Bill Heelan dan J. Peter
Deutsch, saat itu adalah mahasiswa ilmu komputer Universitas McGill,
Amerika Serikat. Cara kerja program tersebut adalah mengunduh daftar
direktori serta berkas yang terdapat pada layanan ftp publik (anonim)
kemudian memuatnya ke dalam basisdata yang memungkinkan pencarian.
Mesin pencari lainnya seperti Aliweb, muncul di 1993 dan masih berjalan
hingga saat ini. Salah satu mesin pencari pertama yang sekarang
berkembang menjadi usaha komersial yang cukup besar adalah Lycos, yang
dimulai di Carnegie Mellon University sebagai proyek riset di tahun
1994.
Segera setelah itu, banyak mesin pencari yang bermunculan dan bersaing
memperebutkan popularitas. Termasuk di antaranya adalah WebCrawler,
Hotbot, Excite, Infoseek, Inktomi, dan AltaVista. Masing-masing bersaing
dengan menambahkan layakan-layanan tambahan seperti yang dilakukan oleh
Yahoo.
Tahun 2002 Yahoo! mengakuisisi Inktomi, setahun kemudian mengakuisisi
AlltheWeb dan Altavista kemudian meluncurkan mesin pencari sendiri yang
didasarkan pada teknologi gabungan dari mesin-mesin pencari yang telah
diakuisisinya serta memberikan layanan yang mengutamakan pencarian Web
daripada layanan-layanan lainnya.
Di bulan desember 2003, Orase menerbitkan versi pertama dari teknologi
pencari waktu-riilnya. Mesin ini memiliki banyak fungsi baru dan tingkat
unjuk kerja yang jauh lebih baik.
Mesin pencari juga dikenal sebagai target investasi internet yang
terjadi pada akhir tahun 1990-an. Beberapa perusahaan mesin pencari yang
masuk ke dalam pasar saham diketahui mencatat keuntungan besar.
Sebagian lagi sama sekali menonaktifkan layanan mesin pencari, dan hanya
memasarkannya pada edisi-edisi enterprise saja, contoh Northern Light
sebelumnya diketahui merupakan salah satu perintis layanan mesin pencari
di internet.
Buku Osmar R. Zaïane From Resource Discovery to Knowledge Discovery on
the Internet menjelaskan secara rinci sejarah teknologi mesin pencari
sebelum munculnya Google. Mesin-mesin pencari lainnya mencakup a9.com,
AlltheWeb, Ask Jeeves, Clusty, Gigablast, Teoma,Wisenut, GoHook, Kartoo,
dan Vivisimo.
Mesin pencari web bekerja dengan cara menyimpan informasi tentang banyak
halaman web, yang diambil langsung dari WWW. Halaman-halaman ini
diambil dengan web crawler — browser web otomatis yang mengikuti setiap
pranala/link yang dilihatnya. Isi setiap halaman lalu dianalisis untuk
menentukan cara indeks-nya (misalnya, kata-kata diambil dari judul,
subjudul, atau field khusus yang disebut meta tag). Data tentang halaman
web disimpan dalam sebuah database indeks untuk digunakan dalam
pencarian selanjutnya. Sebagian mesin pencari, seperti Google, menyimpan
seluruh atau sebagian halaman sumber (yang disebut cache) maupun
informasi tentang halaman web itu sendiri.
Selain halaman web, Mesin pencari juga menyimpan dan memberikan
informasi hasil pencarian berupa pranala yang merujuk pada file, seperti
file audio, file video, gambar, foto dan sebagainya, serta informasi
tentang seseorang, suatu produk, layanan, dan informasi beragam lainnya
yang semakin terus berkembang sesuai dengan perkembangan teknologi
informasi.
Ketika seseorang mengunjungi mesin pencari dan memasukkan query,
biasanya dengan memasukkan kata kunci, mesin mencari indeks dan
memberikan daftar halaman web yang paling sesuai dengan kriterianya,
biasanya disertai ringkasan singkat mengenai judul dokumen dan
kadang-kadang sebagian teksnya.
Ada jenis mesin pencari lain: mesin pencari real-time, seperti Orase.
Mesin seperti ini tidak menggunakan indeks. Informasi yang diperlukan
mesin tersebut hanya dikumpulkan jika ada pencarian baru. Jika
dibandingkan dengan sistem berbasis indeks yang digunakan mesin-mesin
seperti Google, sistem real-time ini unggul dalam beberapa hal:
informasi selalu mutakhir, (hampir) tak ada pranala mati, dan lebih
sedikit sumber daya sistem yang diperlukan. (Google menggunakan hampir
100.000 komputer, Orase hanya satu.) Tetapi, ada juga kelemahannya:
pencarian lebih lama rampungnya.
Manfaat mesin pencari bergantung pada relevansi hasil-hasil yang
diberikannya. Meskipun mungkin ada jutaan halaman web yang mengandung
suatu kata atau frasa, sebagian halaman mungkin lebih relevan, populer,
atau autoritatif daripada yang lain. Kebanyakan mesin pencari
menggunakan berbagai metode untuk menentukan peringkat hasil pencarian
agar mampu memberikan hasil "terbaik" lebih dahulu. Cara mesin
menentukan halaman mana yang paling sesuai, dan urutan halaman-halaman
itu diperlihatkan, sangat bervariasi. Metode-metode nya juga berubah
seiring waktu dengan berubahnya penggunaan internet dan berevolusinya
teknik-teknik baru.
Sebagian besar mesin pencari web adalah usaha komersial yang didukung
pemasukan iklan dan karenanya sebagian menjalankan praktik
kontroversial, yaitu membolehkan pengiklan membayar agar halaman mereka
diberi peringkat lebih tinggi dalam hasil pencarian.

Tidak ada komentar:
Posting Komentar