10. MPP системы. Распределенное и колоночное хранение. Распределенные вычисления, модель MapReduce. Обеспечение отказоустойчивости.

Существует два вида масштабирования серверов БД.

  1. Вертикальное масштабирование.
  2. Горизонтальное масштабирование.

При вертикальном масштабировании увеличиваются ресурсы (улучшается железо) одного сервера (например, добавляются плашки оперативной памяти). Отсюда возникает проблема вертикального масштабирования — есть пределы этого улучшения (например, количество слотов оперативной памяти).

При горизонтальном масштабировании увеличивается количество серверов (создается кластер). Пределы этого увеличения тоже существуют: при достижении определенного числа серверов в кластере время диспетчеризации будет превышать время работы сервера (аналогия с 4 лабораторной работой по АА).

Одним из примеров горизонтального масштабирования является MPP (in English — Massive Parallel Processing) (in Russian — Массивно-параллельные вычисления).

MPP — структура, в которой вместо одного перегруженного сервера используется несколько слегка нагруженных.

Untitled

При использовании массивно-параллельной архитектуры данные разделяются на фрагменты. обрабатываемые независимыми центральными процессорами (CPU) и хранящиеся на разных носителях.

Vertica

Vertica представляет собой колоночную СУБД с поддержкой MPP.

Основные свойства:

Как Vertica хранит данные?

Логические единицы хранения информация — таблицы, схемы, представления.