Bài 5: Tìm hiểu về cơ chế hoạt động của Google

co-che-hoat-dong-google-spider


Tìm hiểu về cơ chế hoạt động của Google

Cũng giống như các bộ máy tìm kiếm (Seach Engine) khác. Google cũng được cấu tạo bởi 3 bộ phận chính:

  • Bộ phận thu thập thông tin từ các website Google Spider (Bot)
  • Bộ phận Lập chỉ mục
  • Bộ phận xử lý, tính toán và mã hóa dữ liệu

search engine bo may tim kiem

1. Bộ phận thu thập thông tin Google Spider (Bot).

Thông thường, website nào chúng ta đều thấy cấu trúc của tệp Rotbots.txt ở mục index. File Robots.txt này có nhiệm vụ điều hướng con bọ tìm kiếm Google Spider. Bản thân Google Spider là một loại Robots hoạt động dựa trên liên kết. Quy trình của nó cũng khá đơn giản. Khi truy cập vào 1 website bất kỳ. Google Spider tìm đọc đến file Robots.txt và File .Htaccess để xem nó được quyền truy cập vào những thư mục nào của website đó. Đồng thời nhận dạng chuỗi liên kết tĩnh Permalink được cấu hình tại File Htaccess. Tiếp sau đó Google Spider tiếp tục truy cập vào File Sitemap.xml (sơ đồ trang web). Tại File Sitmap.xml, Các quản trị web (admin) đã cấu hình sẵn 1 sơ đồ hệ thống thống các webpage.

google-spider

Từ đây, Google Spider tiến hành đi theo các liên kết tại File Sitemap.xml và thu thập thông tin dữ liệu. Các dữ liệu Website của bạn được Google Spider Craw sẽ được gửi về máy chủ (Sever) để lập chỉ mục và xử lý tính toán!.

2. Lập chỉ mục

Sau khi dữ liệu được Craw thành công sẽ được chuyển tiếp về bộ phận lập chỉ mục. Tại đây Google tiến hành quá trình đọc hiểu, phân loại nội dung và tiến hành lập chỉ mục cho nội dung website của bạn. Mỗi một chỉ mục thường được lưu trữ ở các Sever độc lập khác nhau sau quá trình tính toán, xử lý và mã hóa thông tin dữ liệu!.

lap-chi-muc-google

3. Xử lý, tính toán và Mã hóa dữ liệu.

Tại quy trình này, dựa vào các dữ liệu thu thập được. Kết hợp cùng hơn 200 tiêu chí xếp hạng từ khóa và gần 500 thuật toán tìm kiếm. Google sẽ tiến hành xuất bản thứ hạng cho website của bạn. Đồng thời mã hóa dữ liệu và lưu vào bộ nhớ Cache.

tinh-toan-xu-ly-ma-hoa-du-lieu-google

Kết Luận: Tại bài viết này mình đã phân tích khá chi tiết về các bộ phận cấu trúc nên bộ máy tìm kiếm (Search Engine) Google. Hy vọng các bạn đã có thể nắm vững được cách thức hoạt động của Google. Từ quá trình index, Craw dữ liệu trong website của bạn cho tới quá trình tính toán, phân tích và xử lý dữ liệu. Hãy học từ nguyên lý và hiểu tận gốc rễ để xây dựng cho bản thân những nền tảng kiến thức nền móng. Thanks!.


ho quang hien

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>


seo

Quảng Cáo Google Adwords