Как через xpath достать язык страницы?

Ссылка скопирована
6 января 2026 1 ответ

Допустим в коде есть , использую парсер screaming frog, можно через xpath спарсить значение атрибута? Или какие еще есть практики с помощью xpath html. Не везде есть именно этот код, так же ведь используется и Content-Language: . Не нашел в интернете ничего толкового на этот счет, но платные парсеры без проблем язык парсят с любых страниц.

Дополнительно:

Допустим в коде есть ,

Кажется, Вы забыли что то вставить...

Как через xpath достать язык страницы?

Если в html имеется атрибут lang, то можно получить его значение: /html/@lang

Нужно решить такую задачу?

Опишите проблему, и специалист поможет с настройкой, исправлением ошибки или доработкой сайта. Подберём понятный план работ без лишней переписки.

Заказать помощь
Лучший ответ
1
Артём Dev Ответ

Для того чтобы через XPath получить язык страницы, необходимо использовать атрибут lang или xml:lang, который указывает на язык, на котором написан контент страницы.

Пример кода на PHP, использующий XPath для извлечения языка страницы:

// Создаем объект DOMDocument
$doc = new DOMDocument();
// Загружаем HTML страницу
$doc->loadHTMLFile('http://www.example.com');
 
// Создаем объект DOMXPath
$xpath = new DOMXPath($doc);
 
// Используем XPath запрос для извлечения языка страницы
$lang = $xpath->query('//html/@lang');
 
// Проверяем, найден ли язык
if ($lang->length > 0) {
    // Выводим найденный язык
    echo $lang->item(0)->nodeValue;
} else {
    // Если язык не найден, выводим сообщение об ошибке
    echo 'Язык страницы не найден';
}

// Создаем объект DOMDocument $doc = new DOMDocument(); // Загружаем HTML страницу $doc->loadHTMLFile('http://www.example.com'); // Создаем объект DOMXPath $xpath = new DOMXPath($doc); // Используем XPath запрос для извлечения языка страницы $lang = $xpath->query('//html/@lang'); // Проверяем, найден ли язык if ($lang->length > 0) { // Выводим найденный язык echo $lang->item(0)->nodeValue; } else { // Если язык не найден, выводим сообщение об ошибке echo 'Язык страницы не найден'; }

Этот код загружает HTML страницу по указанному URL, использует XPath запрос для извлечения языка страницы и выводит его значение. Помимо атрибута lang, также можно использовать xml:lang для извлечения языка страницы.

Другие ответы (0)

Пока нет других ответов. Будьте первым, кто поможет автору.

Ответить на вопрос

комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Вам также может быть интересно