Парсинг сайта

Меры безопасности при поиске исполнителя
Dmit
Сообщения: 9
Зарегистрирован: 25.04.2025

Парсинг сайта

Непрочитанное сообщение Dmit »

Всем привет! Не могу справится с парсингом товаров с сайта поставщика (https://automagic-ural.ru/collection/shine-systems) интересует именно эта категория. Нужны данные: наименование, цена, фото (именно с фото проблема случилась), описание товара. Если кто-то сможет сделать - пишите с предложением сроков и цены.

Телега: @twowhiterose
Аватара пользователя
Tom
Разработчик дополнений
Сообщения: 199
Зарегистрирован: 10.03.2022
Откуда: Казахстан - Алматы
Поблагодарил: 10 раз
Спасибо: 82 раз

Re: Парсинг сайта

Непрочитанное сообщение Tom »

Изображения хранятся на другом ресурсе,  плюс используется скрипт  некой защиты и ресайза отсюда
https://github.com/imgproxy/imgproxy
В ссылке на изображение есть масса парметров .
  • r/7qw-bFlei-M — возможно, подпись или ключ (signature в терминах imgproxy).
  • rs:fit:500:0:1 — ресайз (resize=fit, width=500, height=0, enlarge=1).
  • q:100 — качество (quality=100%).
  • plain/... — путь к исходному изображению.
  • @webp — формат на выходе.
И отсюда по сути и решение. Убрать все эти параметры из ссылки
Полная ссылка
static.insales-cdn.com/r/7qw-bFlei-M/rs:fit:500:0:1/q:100/plain/images/products/1/102/943915110/shine-systems-avd-rr-1520n.jpg@webp
Убираем параметры и формат (webp)
static.insales-cdn.com//images/products/1/102/943915110/shine-systems-avd-rr-1520n.jpg
Готово
Было ---> Стало
Dmit
Сообщения: 9
Зарегистрирован: 25.04.2025

Re: Парсинг сайта

Непрочитанное сообщение Dmit »

Хм... Как же убрать все эти параметры, если, допустим, в каждой ссылке они разные?

И еще такой вопрос (не в тему) - где взять старый добрый import/export? Все, что находил устанавливалось нормально, но в панели управления не появлялось...
Аватара пользователя
Tom
Разработчик дополнений
Сообщения: 199
Зарегистрирован: 10.03.2022
Откуда: Казахстан - Алматы
Поблагодарил: 10 раз
Спасибо: 82 раз

Re: Парсинг сайта

Непрочитанное сообщение Tom »

Dmit писал(а): 29 апр 2025, 01:23 Как же убрать все эти параметры, если, допустим, в каждой ссылке они разные?

Зависит от используемого парсера. Используйте регулярку.
Dmit писал(а): 29 апр 2025, 01:23 И еще такой вопрос (не в тему) - где взять старый добрый import/export?

Всё там же.
https://www.opencart.com/index.php?rout ... sion_id=17
Аватара пользователя
Rubynoid
Разработчик дополнений
Сообщения: 15
Зарегистрирован: 28.07.2022
Откуда: https://t.me/rubynoid
Контактная информация:

Re: Парсинг сайта

Непрочитанное сообщение Rubynoid »

Dmit писал(а): 28 апр 2025, 21:20 Всем привет! Не могу справится с парсингом товаров с сайта поставщика (https://automagic-ural.ru/collection/shine-systems) интересует именно эта категория. Нужны данные: наименование, цена, фото (именно с фото проблема случилась), описание товара. Если кто-то сможет сделать - пишите с предложением сроков и цены.

Телега: @twowhiterose

Ответил в личку
ОБНОВЛЕНИЕ ДВИЖКА. ПАРСИНГ И ИМПОРТ ТОВАРОВ. Телеграмм @Rubynoid
Ответить