'
Баева В.Р., Дроздов А.Ю.
ETL: АКТУАЛЬНОСТЬ И ПРИМЕНЕНИЕ. ПРЕИМУЩЕСТВА И НЕДОСТАТКИ ETL ИНСТРУМЕНТОВ *
Аннотация:
в данной статье описывается актуальность и применение ETL, а также, преимущества и недостатки ETL инструментов
Ключевые слова:
хранилище данных, ETL процесс, ETL инструмент
Многим знакомо выражение: «Кто владеет информацией, тот владеет миром» (Н. Ротшильд). Около 80% сегодняшних данных было создано только за последние два года [1]. Благодаря технологическому развитию данные стали важной темой и ключевым фактором успеха бизнеса. Однако, многие компании осознали, что просто владеть информацией недостаточно. Огромное количество необработанной информации само по себе не имеет большой ценности, пока не будет хорошо структурировано, проанализировано и интерпретировано. Нужно владеть именно качественной информацией. Чтобы извлечь выгоду из всех данных, были изобретены хранилища данных [2] и ETL [3]. Но что же такое хранилище данных и ETL? С годами появилось много разных понятий этих двух терминов. Наиболее распространенное определение хранилища данных на рынке: система, которая извлекает, трансформирует и доставляет исходные данные в целевое хранилище, чтобы их можно было использовать для запросов и анализа. Основная задача - предоставить надежные и точные данные, которые можно использовать для принятия важных бизнесрешений. Чтобы достичь этого, данные из одной или нескольких систем должны быть извлечены и скопированы в хранилище данных, что выполняется инструментами ETL. ETL определяется как процесс, который извлекает данные из различных исходных систем, затем преобразует данные (например, применяет фильтрацию, вычисления, объединения и т. д.) И, наконец, загружает данные в систему хранилища данных. ETL - является аббревиатурой для Extract, Transform и Load [4]. Опишем более подробно: 1 этап – Extract (извлечение). Этап извлечения охватывает извлечение данных из нескольких исходных систем и подготовку данных для следующих шагов. Основная цель этого шага состоит в том, чтобы получить все необходимые данные из исходных систем с минимально возможными ресурсами. 2 этап – Transform (преобразование). После извлечения, данные, являются необработанными и не могут использоваться в исходном виде. На этом этапе применяет набор правил для преобразования данных из источника (генерируются новые рассчитанные значения, производится дедубликация данных и т.д.) 3 этап – загрузка На этапе загрузки необходимо убедиться, что загрузка выполняется правильно и с минимально возможными ресурсами.
Номер журнала Вестник науки №5 (14) том 4
Ссылка для цитирования:
Баева В.Р., Дроздов А.Ю. ETL: АКТУАЛЬНОСТЬ И ПРИМЕНЕНИЕ. ПРЕИМУЩЕСТВА И НЕДОСТАТКИ ETL ИНСТРУМЕНТОВ // Вестник науки №5 (14) том 4. С. 446 - 449. 2019 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/1446 (дата обращения: 25.04.2024 г.)
Вестник науки СМИ ЭЛ № ФС 77 - 84401 © 2019. 16+
*