Data Lake — озёра данных, которые помогают быстро и недорого работать с большими объёмами неструктурированных данных.
На вебинаре Михаил Кобик расскажет о своём опыте создания Data Lake на ~80 ТБ с помощью Apache Kafka.
Поговорим о некоторых особенностях эксплуатации kafka с retention в 99999999 и о том как жить, если kafka единственный источник данных в информационной системе.