1. Tên miền và Hosting
Tên miền có ảnh hưởng rất lớn đến thứ hạng của tất cả các trang web trên website. Vì lý do này, bạn nên lựa chọn:
– Tên miền chứa từ khóa (có hiệu quả ngay)
– Tên miền theo thương hiệu (về lâu dài sẽ tốt hơn tên miền từ khóa)
– Sử dụng những tên miền đã có tuổi thọ, PageRank cao
– Đuôi theo địa lý, ví dụ: .VN sẽ tốt hơn khi SEO ở Việt nam
– Càng ngắn gọn càng tốt, tránh nhầm lẫn, nghe 1 lần là nhớ và có thể viết lại được. Hiện nay, để sở hữu một tên miền từ khóa đẹp rất khó. Thường thì bạn phải mua lại với giá cao hoặc sử dụng dịch vụ BACKORDER – đăng ký lại tên miền ngay khi hết hạn, thường là do chủ sở hữu quên không gia hạn.
2. Hosting
– Là nơi lưu trữ nội dung website. Bạn nên chọn dịch vụ hosting chất lượng (máy chủ mạnh, băng thông rộng), càng gần khách hàng tiềm năng càng tốt. Ví dụ: nếu bạn hướng đến khách hàng ở Nhật thì bạn nên đặt website ở Nhật.
3. Ngôn ngữ trang web
– Bạn có thể thông báo với Search Engine biết trang web của bạn dùng ngôn ngữ gì, bằng cách sử dụng thuộc tính lang hoặc xml:lang trong thẻ HTML;
– Nếu bạn không cài đặt ngôn ngữ thì các Search Engine cũng có thể tự phát hiện ra được. Tuy nhiên, bạn càng rõ ràng thì Search Engine sẽ thích hơn.
4. File robots.txt
– Khi Robot truy cập vào 1 website, trước khi đọc nội dung các trang web, nó sẽ tìm đến file robots.txt. Đây là một file text, đặt ở thư mục gốc, chứa các dòng lệnh dùng để CẤM Robot không được truy cập đến 1 số tài nguyên trên website. Trong website của bạn chắc chắn sẽ có một số trang, thư mục, file mà bạn không muốn bị người khác “nhòm ngó”. Khi đó bạn hãy sử dụng lệnh DisAllow để cấm Robot đọc. Nếu bạn sử dụng lệnh Allow: /, tất cả mọi ngóc ngách trong website sẽ được Google index.
– Cách tạo file Robot.txt
+ Bước 1: Mở notepad và soạn nội dung theo mẫu sau
User-agent: * <– tất cả các spiders
Disallow: /admin/ <– cấm đọc các trang trong
Disallow: /private/ thư mục admin.
Disallow: /backup/
Allow:/ <– cho phép đọc phần còn lại
+ Bước 2: Copy file lên thư mục gốc của website Nếu thấy website bị mất nhiều index, bạn hãy kiểm tra file robots.txt xem có dòng cấm (DISALLOW) Robot đọc nội dung trang web hay không.
Ngoài cách sử dụng file robots.txt, bạn có thể sử dụng thẻ META ROBOTS trong phần … của nội dung HTML để điều khiển Robot truy cập vào trang web đó: Trong đó, giá trị của trường content:
+ ALL Cho phép Robots Index và đi theo links tới trang khác = Index, Follow
+ NONE Không cho Index và không cho đi tới trang khác
+ NoIndex, NoFollow
+ [NO]INDEX [Không] cho phép Robot index trang web
+ [NO]FOLLOW [Không] cho phép Robot lần theo các link đến trang đích, không truyền giá trị cho trang đích. Khi Robot đọc file robots.txt, nó sẽ đưa nội dung của file này về máy chủ để báo cáo. Bạn có thể xem nội dung này trong Webmaster Tools, menu: Tình trạng >> URL bị chặn
==> Ở bài học sau các bạn sẽ được nghiên cứu phần Sitemap của website.