Лекция №10. Сортировка. Часть №2. Предмет "Структуры и...

Хакасский государственный университет им. Н.Ф. Катанова

Структуры и алгоритмы обработки данных

Лекция: Сортировка. Часть №2.

Николай Гребенщиков, www.grebenshikov.ru

Сортировка с разделением (быстрая сортировка)

1. Разделяем массив на два подмассива [1 . . . m] и [m + 1 . . . N ],причем ∀i, j : 1 ≤ i ≤ m ∧m < j ≤ N ⇒ ai ≤ aj

2. Рекурсивно сортируем получившиеся два подмассива.

m называется медианой.

Алгоритм быстрой сортировки

QuickSort(A, p, r)

1 if p < r

2 then q ← Partition(A, p, r)

3 Quicksort(A, p, q − 1)

4 Quicksort(A, q + 1, r)

Алгоритм разделения в быстрой сортировке

Partition(A, p, r)

1 x← A[r]

2 i← p− 1

3 for j ← p to r − 1

4 do if A[i] ≤ x

5 then i← i + 1

6 Обменять A[i]↔ A[j]

7 Обменять A[i + 1]↔ A[r]

8 return i + 1

Алгоритм быстрой сортировки на С

Работа быстрой сортировки (1 из 2)

Работа быстрой сортировки (2 из 2)

Анализ быстрой сортировки (наихудший случай)

Предположим, что все элементы различны.

Наихудший случай: когда при разделении один из массивовне имеет элементов.

T (n) = T (0) + T (n− 1) + Θ(n)= Θ(1) + T (n− 1) + Θ(n)= T (n− 1) + Θ(n)= Θ(n2)

C(N) = M(N)

Анализ быстрой сортировки (наихудший случай)

T (n) = Θ(n∑

c · k) + n ·Θ(1) = Θ(n2 + n) = Θ(n2)

Анализ быстрой сортировки (наилучший случай)

Наилудший случай: когда при разделении массив разделяет-ся на равные части.

T (n) = 2T (n/2) + Θ(n)= Θ(n · log(n))

Рандомизированная быстрая сортировка

• Время работы не зависит от порядка элементов во вход-ных данных.

• Не нужно предположений о распределении входных дан-ных.

• Нет входных данных, которые приводят к наихудшемуслучаю.

• Наихудший случай определяется только генератором слу-чайных чисел.

Рандомизированная быстрая сортировка

Выбираем граничный элемент случайным образом!

RandomizedPartition(A, p, r)

1 i← Random(p, r)

2 Обменять A[r]↔ A[i]

3 return Partition(A, p, r)

RandomizedQuickSort(A, p, r)

1 if p < r

2 then q ← RandomizedPartition(A, p, r)

3 RandomizedQuicksort(A, p, q − 1)

4 RandomizedQuicksort(A, q + 1, r)

Анализ рандомизированной быстрой сортировки

T (n) = функция имеющая случайный характер. Пусть выборэлемента разделения осуществляется независимым образом.

Введем случайный индикатор: Xk =

1, разделение(k : n− k − 1)

0, иначе

E[Xk] = 0 · Pr {Xk = 0}+ 1 · Pr {Xk = 1} = Pr {Xk = 1} = 1n

T (n) =

T (0) + T (n− 1) + Θ(n), разделение(0 : n− 1)

T (1) + T (n− 2) + Θ(n), разделение(1 : n− 2)

T (n− 1) + T (0) + Θ(n), разделение(n− 1 : 0)

=n−1∑k=0

Xk(T (k) + T (n− k − 1) + Θ(n))

E[T (n)] = E[n−1∑k=0

Xk(T (k) + T (n− k − 1) + Θ(n))]

= E[Xk] · E[n−1∑k=0

T (k) + T (n− k − 1) + Θ(n))]

n−1∑k=0

E[T (k)] +1

n−1∑k=0

E[T (n− k − 1)] +1

n−1∑k=0

E[T (k)] + Θ(n)

n−1∑k=2

E[T (k)] + Θ(n)

Докажем, что E[T (n)] ≤ a · n · log(n), для a− const, a > 0.

Базовый шаг: выберем a, что E[T (n)] ≤ a · n · log(n) длямалого n.

Используем факт, чтоn−1∑k=2

k · log(k) ≤1

2n2log(n)−

Подстановка:

E[T (n)] ≤2

n−1∑k=2

a · k · log(k) + Θ(n)

2n2log(n)−

8n2) + Θ(n)

= a · n · log(n)− (a · n

4−Θ(n))

≤ a · n · log(n), еслиa · n

4> Θ(n)

Наименьшее время сортировки

Теорема. В любом алгоритме, упорядочивающем с помо-щью сравнения пар, на упорядочивание последовательностииз N элементов тратится не меньше c · N · log2N сравненийпри c = 0 и N →∞.

T (n) > c ·N · log2N , при c = 0 и N →∞

Наименьшее время сортировки. Доказательство

Число перестановок последовательности из N элементов рав-но N !.

Сортировка путем сравнения пар есть спуск по дереву ре-шений - двоичному, где листья перестановки, а внутренниеузлы условия.

Дерево решений сортировки для последовательностииз 3-х элементов

Наименьшее время сортировки. Доказательство

N ! ≥(

h ≥ log2(N !) ≥ N2 log2

N2 ≥

N4 log2N

Сортировка за линейное время. Сортировка подсчетом

• Все n входных элементов - целые числа, пренадлежащие[0, k], где k - целая константа.

• Если k = O(n), то T (n) = Θ(n)

Сортировка подсчетом

CountingSort(A, B, k)

1 for i← 0 to k

2 do C[i]← 0

3 for j ← 1 to length[A]

4 do C[A[j]]← C[A[j]] + 1

5 � В C[i] хранится количество элементов равных i

6 for i← 1 to k

7 do C[i]← C[i] + C[i− 1]

8 � В C[i] хранится количество элементов не превышающих i

9 for j ← length[A] downto 1

10 do B[C[A[j]]]← A[j]

11 C[A[j]]← C[A[j]]− 1

Сортировка подсчетом

Визуализация?

Сортировка за линейное время

На семинар:

• Поразрядная сортировка

• Карманная сортировка

Список литературы

• Цикова В.А., Чурина Т.Г. Методы программирования: пе-рестановки, поиск и сортировка: Учеб. пособие / Ново-сиб. гос. ун-т. Новосибирск, 2006. Ч.2. 58 с. сс.42-47.

• Ахо А., Хопкрофт Д., Ульман Д. Структуры данных иалгоритмы. - М. : Издательский дом “Вильямс”, 2000.сс.235-257.

• Кормен Т., Лейзерсон Ч., Ривест Р., Штайн К. Алгорит-мы: построение и анализ, 2-е издание. - М. : Издатель-ский дом “Вильямс”, 2007. сс.198-239.

• Кнут Д, Искусство программирования, том 3. Сортировкаи поиск, 2-е изд. - М. : Издательский дома “Вильямс”,2000. сс.192-203.

Лекция №10. Сортировка. Часть №2. Предмет "Структуры и...

Education

Transcript of Лекция №10. Сортировка. Часть №2. Предмет "Структуры и...

Алгоритмы и структуры данных осень 2013 лекция 1

Алгоритмы и структуры данных весна 2014 лекция 3

Алгоритмы и структуры данных осень 2013 лекция 6

Лекция №2. Абстрактные типы данных. ООП. Предмет "Структуры и алгоритмы обработки данных"

Лекция №5. Линейные структуры данных. Предмет "Структуры и алгоритмы обработки данных"

Алгоритмы для NP-трудных задач Лекция 7: Алгоритмы … · Алгоритмы для NP-трудных задач Лекция 7: Алгоритмы

02 сортировка и поиск

ОПК № 2 – Алгоритмы и структуры данных, язык C

сортировка массива

ЛЕКЦИЯ № 2. Алгоритмы циклической структуры. · ЛЕКЦИЯ 2. Алгоритмы циклической структуры. Цель лекции

Лекция №3. Анализ алгоритмов. Предмет "Структуры и алгоритмы обработки данных"

Лекция №9. Сортировка. Часть №1. Предмет "Структуры и алгоритмы обработки данных"

Алгоритмы и структуры данных · 2012-02-09 · алгоритмы генерирования с наименьшим изменением. Другой класс

Лекция №16. Поиск подстрок. Предмет "Структуры и алгоритмы обработки данных"

Лекция №13. Графы: сильно связные компоненты и остовные деревья. Предмет "Структуры и алгоритмы обработки

Алгоритмы и структуры данных - spbstu.rukspt.icc.spbstu.ru/media/files/2017/asd/01_Intro.pdf · 2017-09-20 · Алгоритмы и структуры данных

Лекция №7. Поиск. Деревья поиска. Предмет "Структуры и алгоритмы обработки данных"

Лекция №1. Введение. Предмет "Структуры и алгоритмы обработки данных"

битоническая сортировка

Лекция №14. Графы: кратчайшие пути и максимальные потоки. Предмет "Структуры и алгоритмы обработки