Cách tận dụng tệp nhật ký để Tìm kiếm Tối ưu hóa động cơ (Tối ưu hóa công cụ tìm kiếm)

Có một khía cạnh kỹ thuật trong tối ưu hóa công cụ tìm kiếm (SEO) mà thường bị bỏ qua. Bạn vẫn cần phải tạo ra nội dung Và xây dựng liên kết ngược, nhưng bạn cũng cần phân tích một số loại dữ liệu, trong đó quan trọng nhất là tệp nhật ký. Phân tích tệp nhật ký sẽ giúp bạn tối ưu hóa trang web của mình hiệu quả hơn để nó đạt được thành công trong kết quả tìm kiếm.

Tệp nhật ký là gì?

Mục lục

Nâng cao sự hiện diện trực tuyến của bạn với Lukasz Zelezny, Chuyên gia Tối ưu hóa Công cụ Tìm kiếm (SEO) với hơn 20 năm kinh nghiệm — hãy đặt lịch hẹn ngay bây giờ.

Đặt lịch tư vấn SEO ngay hôm nay

Còn được gọi là truy cập trực tiếp nhật ký, Tệp nhật ký là các tài liệu chứa thông tin có cấu trúc về lưu lượng truy cập của trang web của bạn. Khi ai đó truy cập trang web của bạn, thông tin về lần truy cập của họ sẽ được ghi lại trong tệp nhật ký. Tệp nhật ký chứa các khối thông tin. Mỗi khối được liên kết với một lần truy cập cụ thể.

Hầu hết các tệp nhật ký đều chứa các thông tin sau về một lần truy cập cụ thể:

• Khách tham quan Internet Giao thức (IP) địa chỉ

•   Ngày và thời gian thăm viếng

• Giao thức truyền tải siêu văn bản (Giao thức truyền thông siêu văn bản (HTTP)Loại yêu cầu và mã trạng thái

Tuyển dụng Chuyên gia Tối ưu hóa Công cụ Tìm kiếm (SEO)

 • URL được yêu cầu

• Trình duyệt người dùng

Tăng lượng khách hàng trực tuyến cùng Lukasz Zelezny, chuyên gia SEO với hơn 20 năm kinh nghiệm — đặt lịch hẹn ngay hôm nay.

Đặt lịch tư vấn SEO ngay hôm nay

• URL giới thiệu

Đo tần suất thu thập dữ liệu Thông qua phân tích tệp nhật ký

Bạn có thể sử dụng tệp nhật ký để đo lường Tần suất. Nhật ký hệ thống không chỉ cung cấp thông tin về người dùng truy cập trang web mà còn cung cấp thông tin về các công cụ tìm kiếm truy cập trang web. Các công cụ tìm kiếm sẽ truy cập trang web của bạn để thu thập dữ liệu. Bằng cách phân tích nhật ký hệ thống, bạn có thể đo lường tần suất truy cập của các công cụ tìm kiếm. nào Google, Bing hoặc các công cụ tìm kiếm khác thu thập dữ liệu trang web của bạn.

Những câu hỏi cần đặt ra cho một chuyên gia tư vấn SEO

Các công cụ tìm kiếm được phân biệt với người dùng thông thường trong tệp nhật ký bằng cách sử dụng chuỗi user agent. Đối với người dùng thông thường, chuỗi user agent là trình duyệt web tiêu chuẩn. Đối với các công cụ tìm kiếm, chuỗi user agent là trình thu thập dữ liệu (crawler), chẳng hạn như Googlebot hoặc Bingbot. Bạn có thể xem tần suất các công cụ tìm kiếm thu thập dữ liệu trên một trang web cụ thể bằng cách phân tích tệp nhật ký.

Xác định lỗi mã trạng thái

Tệp nhật ký có thể giúp bạn xác định các lỗi mã trạng thái. Mã trạng thái là cách trang web của bạn phản hồi các yêu cầu của người truy cập. Khi người truy cập yêu cầu một URL, trang web của bạn sẽ gửi cho họ một mã trạng thái. Một số vấn đề, hoặc khách hàng hoặc máy chủ Lỗi này có thể dẫn đến mã trạng thái lỗi. Thay vì nhận được mã trạng thái 3xx, ví dụ, người truy cập có thể nhận được mã trạng thái 4xx hoặc 5xx.

Lỗi mã trạng thái có thể ảnh hưởng tiêu cực đến SEO của trang web của bạn theo một số cách. Nếu một trang cụ thể gặp lỗi mã trạng thái, các công cụ tìm kiếm có thể loại bỏ nó khỏi chỉ mục của họ. Trang đó cũng sẽ không nhận được nhiều liên kết ngược nếu gặp lỗi mã trạng thái. Nó sẽ hoạt động như chết Giảm thứ hạng tìm kiếm của trang web bằng cách làm giảm chất lượng trang web. hiệu suất

Trong các tệp nhật ký, mã trạng thái được hiển thị cùng với loại yêu cầu HTTP. Bạn sẽ thấy loại yêu cầu HTTP của người truy cập, chẳng hạn như GET hoặc POST, cũng như mã trạng thái mà họ nhận được từ trang web của bạn. Không phải tất cả các mã trạng thái đều là lỗi. Chỉ những mã trạng thái bắt đầu bằng “4” hoặc “5” mới chỉ ra lỗi.

Tối ưu hóa JavaScript

Bạn có thể sử dụng tệp nhật ký để tối ưu hóa JavaScript trên trang web của mình. JavaScript đặt ra những thách thức liên quan đến SEO. Khác với văn bản, các công cụ tìm kiếm gặp khó khăn trong việc thu thập dữ liệu từ JavaScript. Thực tế, Google ban đầu không... JavaScript cho đến năm 2008. Ngay cả ngày nay, Google và các công cụ tìm kiếm khác vẫn thường gặp vấn đề khi cố gắng thu thập dữ liệu từ JavaScript.

Nếu trang web của bạn sử dụng JavaScript, bạn nên xem xét việc sử dụng tệp nhật ký để xác định xem các công cụ tìm kiếm có thể thu thập dữ liệu trang web của bạn hay không. Bạn có thể phân tích các lượt truy cập vào các tệp JavaScript của trang web. Nếu phát hiện ra rằng một tệp JavaScript đang trả về lỗi mã trạng thái, các công cụ tìm kiếm có thể không thể thu thập dữ liệu trang web đó. Bạn có thể mở tệp JavaScript để tối ưu hóa và sửa chữa nó.

Bảo toàn giá trị liên kết trong quá trình chuyển hướng

Phân tích tệp nhật ký có thể giúp bảo vệ trang web của bạn. Liên kết vốn chủ sở hữu Khi chuyển hướng Địa chỉ URL. Không hiếm khi các trang web thay đổi URL của các trang của họ. Khi bạn thay đổi URL của một trang, bạn thường sẽ muốn thiết lập một chuyển hướng. Một liên kết chuyển hướng sẽ cho phép người truy cập truy cập trang bằng cách truy cập vào trang đó. URL. URL cũ sẽ chuyển hướng người truy cập đến URL mới của trang tương ứng.

Tuy nhiên, việc chuyển hướng URL có thể dẫn đến mất mát giá trị liên kết. Các liên kết trỏ đến URL cũ của trang sẽ trở nên ít giá trị hơn. Chuyển hướng về cơ bản làm loãng giá trị xếp hạng của các liên kết. quyền hạn hoặc giá trị liên kết. May mắn thay, bạn có thể bảo toàn giá trị liên kết của trang web bằng cách sử dụng 301 Chuyển hướng.

Chuyển hướng có thể là 301 hoặc 302. Cả hai đều hoạt động bằng cách chuyển hướng người dùng từ một URL cũ sang một URL mới. Sự khác biệt là chuyển hướng 301 được thiết kế cho trường hợp một trang hoặc tài liệu đã được di chuyển vĩnh viễn, trong khi chuyển hướng 302 được thiết kế cho trường hợp một trang hoặc tài liệu đã được di chuyển tạm thời. Với điều đó, chuyển hướng 301 truyền tải lượng liên kết (link equity) nhiều hơn đáng kể so với chuyển hướng 302. Bạn có thể sử dụng tệp nhật ký (log files) để tìm các chuyển hướng 302 — chúng được hiển thị dưới dạng URL giới thiệu — để có thể chuyển đổi chúng thành chuyển hướng 301.

Mẹo phân tích tệp nhật ký

Trước khi có thể phân tích các tệp nhật ký cho SEO, bạn cần phải tải chúng về. Hầu hết các nhà cung cấp dịch vụ hosting sẽ tự động tạo ít nhất một tệp nhật ký cho mỗi trang web được lưu trữ. Bạn có thể tải tệp nhật ký này từ bảng điều khiển của nhà cung cấp hosting.

Tệp nhật ký chứa nhiều dữ liệu, vì vậy chúng thường được nén. Bạn cần tải tệp nhật ký từ bảng điều khiển của nhà cung cấp dịch vụ hosting, sau đó giải nén và lưu vào ổ cứng của bạn. Sau khi lấy được tệp nhật ký, đã đến lúc phân tích nó.

Bạn có thể mở và xem các tệp nhật ký bằng bất kỳ chương trình soạn thảo văn bản nào, bao gồm Notepad. Ngoài việc được nén, hầu hết các tệp nhật ký đều sử dụng định dạng Common Log. Định dạng. Thông số kỹ thuật dạng văn bản này giúp việc đọc trở nên dễ dàng hơn bằng cách loại bỏ nhu cầu sử dụng các chương trình đặc biệt. Khi bạn mở tệp nhật ký máy chủ trong một chương trình soạn thảo văn bản, bạn sẽ thấy thông tin về mỗi lượt truy cập trang web của bạn trên một dòng riêng biệt.

Mặc dù có thể phân tích nhật ký máy chủ trong một chương trình soạn thảo văn bản, việc này có thể tốn nhiều thời gian và công sức. Một phương pháp dễ dàng hơn là sử dụng trình xem nhật ký Apache. Trình xem nhật ký Apache là các chương trình được thiết kế riêng biệt để phân tích nhật ký máy chủ.

Phân tích nhật ký máy chủ là một hình thức SEO kỹ thuật. Khi người dùng và công cụ tìm kiếm truy cập trang web của bạn, thông tin về các lần truy cập của họ sẽ được ghi lại trong nhật ký máy chủ. Bạn có thể phân tích các nhật ký này để đo lường tần suất thu thập dữ liệu, xác định lỗi mã trạng thái, tối ưu hóa JavaScript và duy trì giá trị liên kết trong quá trình chuyển hướng.

Phân tích tệp nhật ký trong SEO

Cập nhật lần cuối vào ngày 28/12/2022 lúc 09:40:37 theo giờ UTC+00:00 bởi Lukasz Zelezny

Chỉ số