Извините, регистрация закрыта. Возможно, на событие уже зарегистрировалось слишком много человек, либо истек срок регистрации. Подробности Вы можете узнать у организаторов события.
В этом году Москва является участником Big Data Week — мирового фестиваля, посвященного теме обработки больших объемов данных. В Москве мероприятия будут проходить 3 дня — 25-27 апреля на Мансарде объединенной компании Афиши и Рамблера.
Программа фестиваля:
Мастер-класс: "Экосистема Hadoop"; (Алексей Филановский, Oracle).
В ходе данного мастер класса вы познакомитесь с ключевыми понятиями hdfs и map reduce, а так же узнаете о том какие утилиты смогут сделать работу с Hadoop удобнее и приятнее.
Лекция: "Apache Hadoop: “Стратегия выживания” для экспоненциально растущих систем/ Apache Hadoop: Evolution of Architecture for Exponential Growth"; (Константин Швачко, WANdisco).
На этой лекции Константин расскажет о своем опыте разработки Hаdoop. Будут приведены примеры проблем возникавших по мере роста обьемов данных и вычислений. А также продемонстрированы решения, которые позволили из системы первоначально работавшей на трех машинах, построить масштабируемую архитектуру для кластеров обьединяющих тысячи серверов.
Лекция: "Cloudera Impala: обработка больших данных в реальном времени"; (Justin Erickson; Cloudera).
The open-source Cloudera Impala project is for the first time making scalable parallel database technology, which is the underpinning of Google’s Dremel as well as that of commercial analytic DBMSs, available to the Hadoop community. With Impala, the Hadoop community now has an open-sourced codebase that allows users to issue low-latency queries to data stored in HDFS and Apache HBase using familiar SQL operators.
This talk will start out with an overview of Impala from the user’s perspective, followed by a presentation of Impala’s architecture and implementation, and will conclude with a comparison of Impala with Apache Hive, commercial MapReduce alternatives, and traditional data warehouse infrastructure.
(лекция на английском языке).
Конференция:
10:30 – 11:00 Welcome Coffee + вступительное слово от организаторов
11:00 – 11:40 Дмитрий Федорук «Photon: Отказоустойчивое и масштабируемое соединение непрерывных
потоков данных»; Google Ireland
11:40 – 12:20 Андрей Выходцев: «Платформа для больших данных IBM»; IBM
12:20 – 13:40 Coffee Break
13:40 – 14:20 Евгений Поляков: «Некоторые особенности хранения данных»; Яндекс
14:20 – 15:00 Павел Мезенцев, Антон Горохов: «Персонализация»; Рамблер
15:00 – 15:40 Ольга Горчинская: «Oracle Endeca Information Discovery для исследования Больших данных»; ФОРС
15:40 – 16:00 Coffee Break
16:00 – 16:40 Максим Лапань, Алексей Романенко: "Использование Hadoop в Mail.ru"; Mail.ru
16:40 – 17:20 Владимир Хлызов: «Azure HDInsight»; МГУПИ
17:20 – 17:40 Coffee Break
17:40 – 18:40 Серия вопросов/ответов со всеми докладчиками
18:40 – 19:00 Спасибо всем компаниям и докладчикам
19:00 … After Party (место уточняется)
Онлайн-трансляция на stream.rambler.ru.
Рамблер