It contains about news content manchunia

The following is a news item must for fans of manchester united so that you can know that there are developments in manchester united this time, ranging from the players, history and even rumors of a transfer.

This is a news item

This content includes news of various kinds, ranging from it, music, politics, business, and gossip about celebrities. This content may not update every day, and this content is also a copy paste from another web article.

content that discuss hacking

This item contains about learning the basics as well as further steps towards a web hacking or something. conten but is only available in Indonesian.

This thread contains linux distributions of various

in this thread there are a few tips and tricks that can be applied in various Linux distributions. but still this thread is just a language of Indonesia.

Showing posts with label Search Engine. Show all posts
Showing posts with label Search Engine. Show all posts

Wednesday, April 6, 2011

Beberapa Kesalahan Web Kita Dijauhi Robot Search Engine


Beberapa Kesalahan Web Kita Dijauhi Robot Search Engine

Robots.txt adalah suatu file yang di berguna untuk memudahkan suatu search engine mengindex halaman web kita.
Jika search engine crawler datang di web kita, maka dia akan mencari file robots.txt dan memberitahukan search engine spider bahwa halaman web tersebut harus di index atau di abaikan.
Berikut beberapa kesalahan mengapa robot search engine menjauh di web kita :

1. Robots.txt rusak atau berisi parameter yang salah salah
Jika robot google salah membaca isi robots.txt anda, maka google akan mengabaikan halaman web anda.
Anda bisa mempelajari tata cara penulisan robots di http://www.robotstxt.org/

2. Halaman web anda mempunyai code terlalu panjang
Jika halaman web anda berisikan code javascript, CSS, Html dan lainnya yang terlalu banyak dan panjang, maka akan membuat web anda susah di akses ( lambat aksesnya).
Jika itu terjadi maka robot search engine akan kesulitan untuk mengurai isi web anda.

3. Navigasi menu web anda mempunyai masalah
Jika anda membuat menu yang menggunakan javascript,DHTML atau AJAX, maka menu tersebut tidak bisa di index oleh robot search engine.
karena robot search engine hanya bisa mengindex link yang menggunakan HTML.

4. URL website anda terlalu banyak variable
Jika url anda terlalu banyak variable, maka google juga akan mengabaikan halaman web anda.
Contoh URL yang terlalu banyak variable :
http://domain.com/page.php?page=1&id=2&mirror=3&direct=index.html

Pernyataan resmi dari search engine google :
“Google indexes dynamically generated webpages, including .asp pages, .php pages, and pages with question marks in their URLs. However, these pages can cause problems for our crawler and may be ignored.”

5. Menggunakan session ID di web anda
Search engine google tidak mau mengindex suatu URL yang berisikan session ID karena menyebabkan duplicate content.
Penggunaan cookies lebih baik dari pada menggunakan session ID

"MEMBUAT SESUATU YANG TIDAK MUNGKIN MENJADI MUNGKIN" 
"FRUZI ALBAR FRUZTECKER"

Share

Twitter Delicious Facebook Digg Stumbleupon Favorites More