Введение Данные – это все. В нашем все более цифровом мире самой большой валютой являются данные. Было золото, потом нефть, а теперь у нас есть данные. Повседневное существование требует принятия решений на различных этапах, и для принятия лучших решений нам необходимо использовать данные. Как мы можем использовать эти данные, спросите вы? Вот тут-то и приходит на помощь аналитика данных. В следующих нескольких абзацах я отвечу на этот вопрос и расскажу вам, что такое аналитика данных. II. Что такое аналитика данных? Определить что-либо сложно. Прежде чем я скажу, что такое аналитика данных, позвольте мне сначала сказать, чем она не является: наука о данных. Хотя это и взаимосвязанные процессы, это два разных процесса. Именно из-за того, что я объединил эти два понятия, мне потребовалось так много времени, чтобы погрузиться в мир аналитики. Наука о данных — это широкая область, которая включает в себя различные аспекты анализа данных, но ее сфера также распространяется на машинное обучение и прогнозное моделирование, а также на использование статистических методов, что позволило мне сохранять здоровую дистанцию! Аналитика данных, с другой стороны, больше ориентирована на изучение данных для поддержки тактических решений и улучшения повседневных операций. Обе области необходимы для использования данных для достижения успеха в бизнесе, но они не одинаковы. Анализ данных и получение из них выводов — вот что такое аналитика. Эти выводы, как правило, сосредоточены на оптимизации производительности, эффективности и прибыли бизнеса. По сути, всякий раз, когда вы интерпретируете данные для принятия стратегически обоснованных решений, вы надеваете шляпу аналитика данных. Чтобы нарисовать простую картину для понимания, подумайте об этом как о секретной формуле, которую Netflix использует, чтобы не дать нам выспаться всю ночь. Существуют различные подходы к анализу данных. Как правило, существует 4 типа анализа данных, которые включают в себя анализ того, что произошло (дескриптивная аналитика), почему что-то произошло (диагностическая аналитика), что произойдет (предиктивная аналитика) и что следует делать дальше. (Предписывающая аналитика). Кроме того, как аналитик данных, вы будете использовать несколько аналитических методов и приемов для обработки данных и извлечения информации. Популярным методом является регрессионный анализ, который включает в себя проверку связи между переменными, которые зависят друг от друга, чтобы определить, как изменение одной может повлиять на другую. Несмотря на все сегодняшние разговоры о данных в сфере технологий, можно было бы подумать, что это что-то новое, но аналитика данных начала существовать не вчера, хотя большая часть этой области сосредоточена на современных разработках. Существует богатый исторический контекст, который развился еще в 18 и 19 веках с появлением раннего статистического анализа. Глядя на историческую эволюцию от ранней компьютерной эры в середине 20-го века, через внедрение программного обеспечения для работы с электронными таблицами, такого как Microsoft Excel, в 1980-х годах, до большого взрыва, которым стал Интернет и большие данные на рубеже тысячелетий, на протяжении всего пути. к сегодняшней прогнозной аналитике благодаря дарам науки о данных, машинного обучения и искусственного интеллекта (ИИ), мы видим переход, вызванный технологическими достижениями, и то, как эта область значительно расширилась. III. Основы данных Данные — это совокупность фактов. Качество данных является важнейшим аспектом работы с данными, и все зависит от того, насколько точны, последовательны, полны, надежны и актуальны наши данные для поставленной задачи. Представьте данные как строительные блоки нашего процесса принятия решений. Когда наши данные высокого качества (то есть они не содержат ошибок, остаются согласованными с течением времени, не имеют пробелов и поступают из надежных источников), это закладывает прочную основу для обоснованных решений и эффективных процессов. Думайте об этом как о надежном GPS для вашей деловой поездки. Чистые данные не только экономят ваше время и усилия по очистке данных, но также укрепляют доверие между вашей командой и заинтересованными сторонами, делая всех более уверенными в знаниях и решениях, которые могут предоставить данные. Кроме того, это инструмент экономии денег, предотвращающий дорогостоящие ошибки в инвестициях, маркетинге и операциях. Более того, наличие чистых данных похоже на совершенствование ваших аналитических инструментов: оно гарантирует точность и надежность ваших моделей и прогнозов. Кроме того, в некоторых отраслях необходимо соблюдать требования соответствия и соблюдать этические нормы в отношении данных. IV. Процесс анализа данных Жизненный цикл анализа данных представляет собой серию этапов и действий, включенных в типичный проект анализа данных. В нем излагаются шаги от определения проблемы до предоставления действенных идей. Курс Google по анализу данных состоит из 6 шагов: спросить, подготовить, обработать, проанализировать, поделиться и действовать. V. Инструменты и технологии Один из способов различения полей — их инструменты. У врачей есть стетоскопы, скальпели и термометры, а у аналитиков — электронные таблицы, SQL и инструменты визуализации. Это некоторые распространенные инструменты анализа данных. Электронная таблица — это программное обеспечение для вычислений и организации данных. Excel – наиболее распространенное приложение для работы с электронными таблицами. Язык структурированных запросов — SQL (произносится как «продолжение») — это язык программирования, созданный для управления базами данных. R — это язык программирования, предназначенный для статистических вычислений, который также имеет возможности визуализации данных. Python — популярная альтернатива R, поскольку, помимо статистических вычислений, он имеет множество других применений. Кроме того, существуют инструменты визуализации, которые делают понимание сложных наборов данных, облегчают взаимодействие данных и выявление ценной информации намного удобнее, чем раньше. Визуализация данных предполагает преобразование необработанных данных в визуальные представления, поэтому необходимы специальные инструменты, такие как Tableau и Power BI. VI. Тематическое исследование Я хочу подчеркнуть важность анализа данных на рынке контента с помощью Netflix. Рассмотрим этот псевдоанализ: когда вы вводите «Игра престолов» в строку поиска Netflix, он заполняет слова до того, как вы закончите печатать, даже если у них нет шоу, но Netflix продолжает возвращать свои шоу. Для меня первый результат — «Ведьмак». Как вы думаете, почему? Зачем предлагать еще одно фэнтезийное шоу, основанное на другой серии вымышленных книг, действие которого происходит в средневековом мире магии и мечей? Почему бы не предложить «Оранжевый — хит сезона?» Это анализ данных в действии. Помимо предложений по контенту, можно с уверенностью предположить, что продюсеры и руководители Los Gatos ожидали совпадения между зрителями GOT и теми, кто бросит монетку «Ведьмаку», прежде чем они выпишут миллионы долларов на производство оригинала Netflix. Были данные, их проанализировали, и на основании этого было принято решение. VII. Конфиденциальность данных и этика Учитывая мой юридический опыт, соображения этической обработки и анализа данных мне особенно интересны, но я только пытаюсь представить анализ данных сегодня, а важность конфиденциальности данных необходимо обсудить более подробно в другой день, тем более что они слышат все, что мы говорим! VIII. Начало работы с аналитикой данных Все, кто хочет узнать больше об аналитике данных или только начинает, могут посмотреть эти интересные ресурсы: : это отличный курс для начинающих, позволяющий заложить основу того, что вам понадобится в вашем путешествии по аналитике данных. Профессиональный сертификат Google Data Analytics : WiDA помогает женщинам развивать навыки работы с данными для карьеры, основанной на данных. Сообщество «Женщины в Африке данных» (WiDA) : статья в Investopedia, в которой немного больше рассказывается о технических тонкостях анализа данных. Аналитика данных: что это такое, как она используется и 4 основных метода IX. Заключение У каждого бизнеса есть свои цели, и путь к достижению этих целей обычно лежит через данные; Именно поэтому наши данные так важны сегодня: благодаря хорошей аналитике вы можете превратить статистику в результаты. Я Джейсон, и меня заинтриговал мир данных. Надеюсь, я помог вам понять, о чем идет речь в этой области. Если эта статья показалась вам интересной или вы только начинаете, удачи вам в дальнейшем изучении и отработке своих навыков. Чтобы узнать больше, вы можете прочитать статьи, специально посвященные любому из четырех типов анализа данных – я немного неравнодушен к прогнозной аналитике! Наконец, не забывайте думать как аналитик данных каждый раз, когда вам нужно принять решение; Желаю вам впереди много удивительных открытий!