Сбор сведений из открытых источников: почему это рискованно, если выкачивается информация из чужих баз данных?

Страницы:  1

Ответить
 

Professor Seleznov


pic
Собрать информацию о человеке или продукте с использованием высоких технологий стало делом техники. В прямом и переносном смысле слова. Однако такое выкачивание данных может стать поводом для судебного разбирательства. Почему это происходит — далее в материале.
Сайт как база данных
Нередко информация, систематизированная на сайте (каталог, соцсеть, маркетплейс), является официально созданной базой данных. Права на нее могут принадлежать компании-разработчику этого сайта. Соответственно, использовать многочисленные указанные материалы на коммерческой основе без разрешения их правообладателя — признается нарушением.
В 2017 году в российских судах началось слушание по делу ООО «В Контакте» против ООО «Дабл Дата».
«Дабл Дата» запустила несколько программ:
  • Поисковую систему (позволяет обнаружить нужный аккаунт человека и предоставить ссылку на него);
  • ПО для визуализации информации по ссылкам;
  • ПО, позволяющее обнаруживать «дубли» аккаунтов пользователей.
ООО «В Контакте» посчитало, что указанное программное обеспечение:
  • работает без надлежащего разрешения;
  • предназначено для скоринга;
  • нарушает их права на сформированную базу данных. 
Последовало обращение в суд.
Дело рассматривалось несколько лет, пройдя последовательно ряд инстанций.
В конечном счете — в Суде по интеллектуальным правам утвердили мировое соглашение между корпорациями.
Юристы-аналитики, разбирая решения СИП (хотя финальной позиции по ключевым вопросам не было), указывают на следующие важные детали:
1. Даже если информацию в базу данных сайта «скидывали» сами пользователи, то это не означает, что создатель (организатор) не имеет прав на эту БД.
2. Изготовителем базы данных считается лицо, вложившее серьезные ресурсы в создание продукта. 
Как найти грань между «можно обрабатывать» и «нельзя»?
Во-первых, свобода доступа к информации закреплена в Конституции. Отдельные факты (цена товара, их характеристика, общедоступные материалы и так далее) — не относятся к категории объектов авторского права.
Во-вторых, изготовитель базы данных получает на нее исключительное право, если в создание продукта были вложены финансовые, организационные или иные затраты.
В-третьих, субъект не может на систематической основе использовать существенную часть чужой базы данных без разрешения правообладателя. Это означает, например, что отдельные элементы или несущественную часть продукта — извлекать разрешено.
Грань между существенностью и несущественностью в этом случае очень тонкая. Она может проходить, например, по объемам извлечения: если используете неважные данные максимум из одного или двух профилей в соцсети, то это может считаться законным; если вы на коммерческой основе извлекаете данные из тысячи профилей, а потом анализируете их и предоставляете третьим лицам, — то это могут признать неправомерным действием.
В-четвертых, под юридической защитой оказывается структура созданной базы данных. 
Базовые правила выкачивания информации в автоматизированном режиме (парсинге)
Не стоит парсить:
  • Относимое к персональным данным (если разрешение прямо не прописано в законе);
  • Размещенный эксклюзивный контент.
При парсинге:
  • Отследите, что указывает владелец сайта в файле robots.txt (он определяет, какие разделы сайта разрешены для индексации поисковиками, а какие — нет);
  • Не направляйте частые запросы к системе (они могут быть расценены как атака).
А на западе кейсов, связанных с парсингом, не было?
Были.
Одно из значимых (и интересных) дел — противостояние соцсети LinkedIn против hiQ Labs.
Представители LinkedIn заявили, что их противники (конкуренты) собирают доступные данные пользователей. Чтобы это пресечь, соцсеть поставила блок на открытые страницы.
В суде ситуация развивалась так:
  • В первой инстанции — LinkedIn запретили ограничивать hiQ Labs по доступу к данным;
  • В апелляции — подобное решение было подтверждено (раз сами пользователи открыли свои страницы, то не стоит их ограничивать в подобном волеизъявлении).
Дело дошло до Верховного Суда, который направил кейс на пересмотр.
Мотивируя свое решение, ВС сослался на дело правоохранителя Роберта Ван Бюрена, который, пользуясь своим должностным положением, вошел в полицейскую базу данных и за взятку предоставил сведения другому о номерном знаке женщины-водителя. Суд посчитал, что в данном случае произошел незаконный неавторизованный доступ к защищенному компьютеру. То есть: полицейский имел полномочия по получению информации, но использовал он их для незаконной цели.
Апелляция, учтя подобное решение, посчитала, что к сайтам, размещенным в публичном поле, невозможно применить концепцию неавторизованного доступа. Доступ к открытым данным ограничивать не стали, нарушение профильного Закона не увидели.
Но компании, имеющие подобные сайты, без защиты не оставили: в пользовательском соглашении можно предусмотреть ограничения, за несоблюдение которых последует иск.

О сервисе Онлайн Патент:

Онлайн Патент — цифровая система № 1 в рейтинге Роспатента. С 2013 года мы создаем уникальные LegalTech‑решения для защиты и управления интеллектуальной собственностью. Зарегистрируйтесь в сервисе Онлайн‑Патент и получите доступ к следующим услугам:
-Источник
 
Loading...
Error