Какую информацию может содержать файл журнала?

Какую информацию может содержать файл журнала Изучение

Когда вы работаете на своем компьютере, просматриваете веб-страницы на своем планшете или работаете с веб-сайтом на сервере, в фоновом режиме незаметно происходят многочисленные процессы. При возникновении проблем, ошибок или если вы хотите понять, какие действия выполняет операционная система или различные программы и службы, вам могут предоставить информацию так называемые лог-файлы. Они автоматически управляются почти всеми приложениями, серверами, базами данных и системами и регистрируют все соответствующие процессы.

Как правило, файлы журналов оцениваются редко — они выполняют функцию, аналогичную бортовому самописцу, который проверяется только в экстренных случаях. Однако из-за сбора подробных данных файлы журналов также являются основным источником для всестороннего расследования программных и системных ошибок и для записи поведения пользователей. Это делает их интересными не только для производителей программного обеспечения, но и для операторов веб-сайтов, которые могут получить интересную информацию из файла журнала своего веб-сервера.

Что такое файл журнала?

Файлы журнала, также известные как файлы журнала событий, представляют собой обычные текстовые файлы. Они содержат все процессы, которые были определены как релевантные программистом соответствующего приложения. Например, в случае файла журнала базы данных это все изменения правильно завершенных транзакций. Если части базы данных удалены, например. в случае сбоя системы файл журнала служит основой для восстановления правильной базы данных.

Файлы журнала автоматически генерируются в соответствии с соответствующим программированием; тем не менее, вы также можете создавать свои собственные файлы журналов, если у вас есть необходимые ноу-хау. Как правило, строка файла журнала содержит следующие две части информации:

  • Записанное событие (например, запуск программы)
  • Отметка времени, которая связывает дату и время с событием

Как правило, время указывается с префиксом, чтобы отразить хронологическую последовательность событий.

Типичные области применения лог-файлов

По умолчанию операционные системы создают несколько файлов журналов, которые классифицируют различные типы процессов. Например, системы Windows ведут журналы событий приложений, системных событий, событий, связанных с безопасностью, событий установки и переадресованных событий. Просматривая соответствующий файл журнала, администраторы получают информацию, которая может помочь им в устранении неполадок. Файлы журналов Windows также показывают, кто и когда входил в систему или выходил из нее. Помимо операционной системы существуют следующие программы и системы, которые в свою очередь собирают самые разные данные:

  • Фоновые программы, такие как Например, почтовые серверы, базы данных или прокси-серверы генерируют файлы журналов, в которых в первую очередь записываются сообщения об ошибках, сообщения о событиях и уведомления. Фон — это в первую очередь резервное копирование и возможное восстановление данных.
  • Установленное программное обеспечение, такое как программы Office, игры, программы обмена мгновенными сообщениями, брандмауэры или антивирусные сканеры, сохраняют самые разнообразные данные в файле журнала. Это могут быть, например, конфигурации или сообщения чата. Прежде всего, здесь основное внимание уделяется сбору сбоев программы в пользу быстрой обработки ошибок.
  • Серверы (особенно веб-серверы ) регистрируют соответствующие сетевые действия, которые содержат полезную информацию о пользователях и их поведении в сети. Помимо прочего, уполномоченные администраторы выясняют, какой пользователь запустил приложение или запросил файл, в какое время, как долго он выполнял соответствующие действия и какая операционная система использовалась. Анализ лог-файлов веб-сервера — один из старейших методов веб-контроля и лучший пример возможностей лог-файлов.
Читайте также:  Изучаем словари в Python - Все, что нужно знать для успешного старта программиста

Яркий пример потенциала лог-файла: лог-файлы веб-сервера.

Первоначально файл журнала веб-серверов, таких как Apache или Microsoft IIS, использовался для стандартной записи и устранения ошибок потока процесса. Однако быстро выяснилось, что файл журнала веб-сервера может предоставить гораздо более ценные данные, такие как информация о популярности и удобстве использования веб-сайта, размещенного на сервере, включая полезную информацию о посетителях, такую ​​как:

  • Время просмотров страниц
  • Количество просмотров страниц
  • Продолжительность сеанса
  • IP-адрес и имя хоста пользователей
  • Информация о запрашивающем клиенте (обычно браузере)
  • Используемая поисковая система, включая поисковый запрос
  • Используемая операционная система

Типичная запись в файле журнала веб-сервера выглядит так:

183.121.143.32 — — [18/Mar/2003:08:04:22 +0200] «GET /images/logo.jpg HTTP/1.1» 200 512 «http://www.wikipedia.org/» «Mozilla/5.0 (X11; U; Linux i686; de-DE; rv: 1.7.5)»

Объяснение отдельных параметров:

смысл образец значения объяснение
айпи адрес 183.121.143.32 IP-адрес запрашивающего хоста
незанятый Идентификатор RFC-1413 не обнаружен по умолчанию
Кто? Показывает имя пользователя, если HTTP-аутентификация имела место; в противном случае остается пустым, как в этом случае
Когда? [18 марта/2003:08:04:22 +0200] Временная метка, состоящая из даты, времени и информации о смещении времени
Какие? ПОЛУЧИТЬ /images/logo.jpg HTTP/1.1 Событие, которое произошло, в данном случае запрос изображения через HTTP
ХОРОШО 200 Подтверждение успешного запроса (код состояния HTTP 200)
Сколько? 512 Если задано: количество переданных данных в байтах
Отсюда? http://www.wikipedia.org/ Веб-адрес, с которого запрашиваются данные
По какому? Mozilla/5.0 (X11; U; Linux i686; de-DE; rv: 1.7.5) Техническая информация о клиенте: браузер, операционная система, ядро, пользовательский интерфейс, голосовой вывод, версия

Для оценки потока информации были разработаны такие инструменты, как Webalizer или W3 Statistics , которые преобразуют собранные данные в содержательную статистику, таблицы и графики. Их можно использовать, например, для определения тенденций роста веб-сайта, удобства использования отдельных страниц или релевантных ключевых слов и тем.

Даже если анализ файла журнала веб-сервера все еще практикуется, он был в значительной степени заменен более новыми методами веб-анализа, такими как файлы cookie или теги страниц. Причины этого кроются, с одной стороны, в высокой частоте ошибок анализа лог-файла при назначении сессий, с другой стороны, в том, что операторы веб-сайтов часто вообще не могут получить доступ к лог-файлу веб-сервера. Все сообщения об ошибках регистрируются немедленно. Кроме того, данные, полученные в результате анализа лог-файла, остаются непосредственно у компании.

Оцените статью
Блог о программировании
Добавить комментарий