Термин » метаданные » относится к информации, дополняющей фактические данные. Метаданные часто предоставляют более подробную информацию о контексте контента или дают инструкции о том, как обращаться с данными.
Оценка метаданных с помощью искусственного интеллекта позволяет делать прогнозы о поведении человека. В перспективе это приводит к серьезной угрозе частной жизни граждан. Метаданные сами по себе не так уж плохи. В этой статье мы объясним, что такое метаданные на самом деле.
- В чем разница между метаданными и данными?
- Какие типы метаданных существуют и как они используются?
- Метаданные, описывающие цифровые изображения
- Метаданные, встроенные в цифровое видео
- Метаданные, связанные с файлами
- Метаданные, генерируемые при отправке электронных писем
- Метаданные, генерируемые при посещении веб-сайта
- Важность метаданных веб-сайта для онлайн-маркетинга и поисковой оптимизации
- Сопоставление метаданных веб-сайта с классическими элементами заголовка HTML
- Сопоставьте метаданные веб-сайта с современными элементами заголовка HTML
- Определите метаданные веб-сайта с помощью Open Graph
- Определите метаданные веб-сайта с помощью расширенных карточек
В чем разница между метаданными и данными?
Чтобы лучше познакомиться с концепцией метаданных, рассмотрим простой пример: вы отправляете письмо по почте. Тогда документ, содержащийся в конверте, соответствует фактическим, первичным данным. Они являются частными и специально защищены законом от доступа третьих лиц — применяется тайна писем.
Конверт содержит метаданные письма. Это дополнительные данные, сопровождающие первичные данные:
- Адрес и отправитель
- Почтовая марка, штемпель
- При необходимости дополнительные маркировки, такие как штрих-коды
Как видите, это все данные, позволяющие отправить письмо. Метаданные письма свободно видны всем снаружи. Они не особо защищены тайной переписки, хотя тайна почты распространяется и на них.
Чем опасны метаданные? Само по себе не проблематично, если отдельные метаданные доступны для чтения. Например, если третья сторона узнала об отдельном конверте, обычно это не повод для беспокойства. Однако это ведет себя иначе в случае массивного хранения и оценки. Затем появляются закономерности, которые многое говорят о поведении человека: кто с кем общался и когда? Таким образом, сети и коммуникационные цепочки могут быть идентифицированы.
Различие между данными и метаданными размыто. Классификация зависит от контекста и точки зрения. Вот еще один пример. Книга содержит первичные данные, такие как название книги и ее содержание. Кроме того, для публикации книги доступен ряд метаданных:
- Автор
- Издатель
- Дата и место публикации
- Версия
- ISBN
Представим, что метаданные многих публикаций собраны в базу данных. Применительно к такой базе данных информация о публикациях будет являться первичными данными. Также будет новый набор метаданных для каждого выпуска. Например, для каждой публикации в базе данных может храниться информация о том, когда и каким пользователем была добавлена запись.
Какие типы метаданных существуют и как они используются?
Метаданные возникают во всех областях хранения и обработки данных. Использование метаданных не может быть однозначно описано. Здесь мы назовем три основные области применения:
1. Дать контекст информации.
Метаданные часто описывают процесс, который привел к генерации информации. Например, подумайте о географических координатах, которые присваиваются цифровым фотографиям. После потери контекст невозможно восстановить, поэтому он сохраняется.
2. Сохранение доступной информации, которую в противном случае пришлось бы тщательно обсчитывать.
На этом этапе подумайте о времени воспроизведения видео. Это встроено как отметка времени в видеофайл. Без сохранения игрового времени его пришлось бы рассчитывать. Жизнеспособным подходом было бы подсчитать количество кадров и разделить его на частоту кадров — относительно большие усилия.
3. Связывайте информацию вместе, упрощайте поиск и поиск.
Основная цель здесь — подкрепить удобочитаемую информацию машиночитаемыми данными. Цель состоит в том, чтобы установить связи между информацией с помощью автоматизированных процессов. В частности, используются структурированные данные, которые связываются для формирования » семантической сети «.
Метаданные, описывающие цифровые изображения
Изображения, сделанные цифровыми камерами и смартфонами, содержат большое количество метаданных. С одной стороны, это включает в себя технические данные, такие как размеры изображения, используемая камера, фокусное расстояние и т. д. Они определены в стандарте EXIF и автоматически создаются камерой. Стандарт IPTC также определяет метаданные, которые описывают содержание фотографии и вводятся пользователем.
| По умолчанию | метаданные изображения | поколение |
| EXIF | Информация об изображении, такая как размеры, цветовое пространство, цветовые каналы и т. д.; Фотографическая информация, такая как время экспозиции, диафрагма, ISO и т. д. | автоматически при записи |
| IPTC | Ключевые слова, авторские права, информация о месте и времени, описание контента и т. д. | вручную пользователем |
Следует проявлять осторожность при обмене цифровыми изображениями: метаданные фотографии могут раскрывать личную информацию об авторе. Поэтому многие приложения и социальные сети автоматически очищают изображения при их загрузке. Однако не следует полагаться на это. В критических случаях лучше использовать специальный инструмент для удаления информации об изображении.
Метаданные, встроенные в цифровое видео
Видеофайл обычно состоит из контейнера, содержащего различные данные. Первичными данными видео являются закодированные видео- и аудиоконтент. Также доступны дополнительные метаданные:
- Время воспроизведения видео
- Скорость передачи данных и размеры изображения
- Информация об используемом аудио- и видеокодеке
- Субтитры, возможно на разных языках
Метаданные, связанные с файлами
Файл в цифровой системе состоит из двух основных частей данных: содержимого файла и его имени. Каждому файлу также назначается набор метаданных. Метаданные файла управляются операционной системой и также известны как «атрибуты файла». Вот обзор общих метаданных файлов:
| Метаданные файла | описание |
| отметка времени | Каждый для создания, модификации и последнего открытия |
| место нахождения | Путь к файлу в файловой системе |
| имущество | владелец и группа |
| права доступа к файлам | читать, писать, выполнять; соответственно для владельца, группы, других |
В дополнение к атрибутам файла некоторые типы файлов включают определенные метаданные. Они управляются соответствующей прикладной программой. Совместное использование этих метаданных также сопряжено с риском раскрытия конфиденциальной информации.
Метаданные, генерируемые при отправке электронных писем
Электронное письмо состоит из двух основных компонентов — аналогично классическому почтовому письму :
- Тело сообщения электронной почты (тело)
- Заголовок электронной почты (шапка)
Тело содержит собственно сообщение, соответствующее документу в конверте. Как и в конверте, заголовок содержит адреса отправителя и получателя. Как и в случае с конвертом, некоторую информацию в заголовке легко подделать. Получателю тогда кажется, что электронное письмо пришло от другого отправителя. Трюк, который часто используется в ходе спуфинговых атак.
Заголовок электронной почты обычно также содержит много других метаданных. Среди прочего, к ним относятся:
- Разные временные метки
- Информация о форматировании и кодировке сообщения
- Станции, через которые проходило электронное письмо во время передачи
- Оценка электронной почты спам-фильтрами
- Индикация того, проверено ли электронное письмо антивирусным сканером
Метаданные заголовка электронной почты записываются и считываются серверным программным обеспечением и прикладными программами. Полученная информация может многое рассказать об электронном письме и пути, по которому оно проходило через Интернет. Среди прочего, могут быть сделаны заявления о подлинности и конфиденциальности электронного письма. Заголовок также может содержать имя хоста вашего собственного устройства и указывать место, откуда было отправлено электронное письмо.
Метаданные, генерируемые при посещении веб-сайта
С технической точки зрения посещение веб-сайта предполагает получение HTML-документа. Браузер пользователя извлекает документ с сервера по указанному адресу. Для этого используется протокол HTTP или HTTPS.
В дополнение к фактическому документу HTML, который отображается в браузере, передаются метаданные, известные как заголовки HTTP. Заголовки HTTP аналогичны полям заголовка электронной почты. Они содержат информацию о кодировании, передаче, шифровании и сжатии HTTP-соединения.
Кроме того, во время передачи генерируются метаданные, которые генерируются на сервере. Сюда входят файлы журналов, в которых регистрируется доступ к серверу и которые необходимы для анализа файлов журналов. При каждом доступе в файл журнала записывается дополнительная строка. Кроме того, браузер обычно инициирует дальнейшие запросы к DNS-серверам. Метаданные также генерируются и, при необходимости, сохраняются и оцениваются оператором сервера.
Как ни странно, заголовок HTML также существует в дополнение к уже упомянутому заголовку HTTP. В то время как первое относится к соединению, второе содержит метаданные, описывающие содержимое документа. Вот пример обзора ответа HTTP-сервера. Начальные строки — это HTTP-заголовок. Ниже приведен исходный текст HTML с элементами заголовка HTML и тела HTML:
HTTP/1.1 200 OK Date: Mon, 01 Feb 2021 12:13:34 GMT Content-Type: text/html; charset=UTF-8 Content-Length: 148 Last-Modified: Wed, 08 Jan 2003 23:11:55 GMT Server: Apache/1.3.3.7 (Unix) (Red-Hat/Linux) Accept-Ranges: bytes Connection: close <html> <head> <title>Eine Beispiel-Seite</title> </head> <body> <p>Der menschenlesbare Text steht im Body des Dokuments</p> </body> </html>
Важность метаданных веб-сайта для онлайн-маркетинга и поисковой оптимизации
В этом разделе мы сосредоточимся на метаданных, встроенных в документ HTML. Мы опускаем уже упомянутые метаданные HTTP, а также метаданные, сгенерированные на стороне сервера, такие как файлы журналов. Обычно метаданные HTML включаются в заголовок HTML-документа.
Многие элементы, используемые в заголовке HTML, используются непосредственно для поисковой оптимизации. Боты поисковых систем сканируют содержимое HTML-документа. Читаемая человеком часть, присутствующая в теле HTML, извлекается и индексируется. Кроме того, есть специальные метаданные, предназначенные исключительно для ботов. Далее мы различаем «классический» и «современный» варианты.
Сопоставление метаданных веб-сайта с классическими элементами заголовка HTML
В дополнение к заголовку классические элементы заголовка HTML включают в себя несколько важных метатегов. Заголовок также виден пользователю в различных формах. Отображается в закладках или в шапке вкладки браузера. Другие классические тегииспользуются исключительно для поисковой оптимизации. Вот обзор наиболее важных классических элементов заголовка HTML:
| День | описание | важность |
| <название> | Название документа, отображаемое в результатах поиска | критический |
| <мета имя=»описание»> | Описание документа, отображаемое в результатах поиска | критический |
| <мета имя=»ключевые слова»> | Ключевые слова документа не отображаются в результатах поиска | небольшое количество |
| <мета имя=»роботы»> | Инструкция поисковым ботам по обработке документа | критический |
Сопоставьте метаданные веб-сайта с современными элементами заголовка HTML
В дополнение к классическим элементам заголовка HTML сегодня используется большое количество других элементов для интеграции метаданных на веб-сайте. Операторы поисковых систем и крупные технологические группы постоянно определяют новые метаданные. Элементы ’’ и ’’ полезны, потому что их можно расширить. Вот обзор часто используемых современных метаданных веб-сайтов:
| День | описание | важность |
| <ссылка отн = «канонический»> | Каноническая ссылка, чтобы избежать дублирования контента | критично, если присутствует дублированный контент |
| <link rel=»alternate» hreflang=»en»> | Укажите альтернативные языковые версии того же документа с помощью атрибута hreflang. | необязательный |
| <мета свойство=»ог:> | OpenGraph для публикации в социальных сетях | необязательный |
Определите метаданные веб-сайта с помощью Open Graph
Open Graph — это протокол, разработанный Google для обогащения веб-документа метаданными. Информация открытого графика предоставляет информацию, которая отображается в виде обзора, когда документ публикуется в социальных сетях. Таким образом можно определить оптимизированные изображения, заголовки и описательные тексты. Это имеет смысл, поскольку каждая платформа имеет определенные ограничения на длину текста, размеры изображения и тому подобное. Протокол широко используется Facebook и Twitter. Вот обзор основных метаданных Open Graph:
| Метаданные Open Graph | Объяснение |
| <meta property=»og:title»> | название объекта |
| <meta property=»og:type»> | Тип объекта, например. B. Изображение, веб-документ, видео и т. д. |
| <meta property=»og:image»> | Изображение, представляющее объект |
| <meta property=»og:url»> | Канонический URL объекта |
Определите метаданные веб-сайта с помощью расширенных карточек
Помимо Open Graph, в Rich Cards используется еще один стандарт метаданных, разработанный Google. Расширенные карточки обогащают веб-документ структурированными метаданными. Например, сайт ресторана можно дополнить информацией о географическом положении, ценах, часах работы и т.д. Информацию о расширенной карточке можно разместить в заголовке HTML или в теле HTML.
Технически расширенные карточки получены из стандарта метаданных Schema.org. Для маркировки метаданных используются различные форматы. Помимо старых стандартов RDFa и Microdata, в наши дни особенно подходит JSON-LD. Google официально рекомендует использование JSON-LD.








