# Priority Queues

In diesem Notebook werden wir zwei einfache Implementationen des ADTs *Priority Queue* anschauen. Diese Implementationen dienen nur zur Illustration des Prinzips, und zur Veranschaulichung, dass auch hier verschiedene Implementation verschiedene Kompromisse machen. Für eine praktische Implementation werden wir später einen Heap verwenden.



## Zwei einfache Implementationen mittels Arrays

#### Implementation mit unsortiertem Array

Die erste Implementation verwendet ein einfaches, unsortiertes (dynamisches) Array. Bei dieser Implementation ist die ```insert``` Methode sehr effizient. Die Hauptarbeit passiert, wenn die Methode ```max``` oder ```delmax``` aufgerufen wird. In diesem Fall wird das grösste Element gesucht und mit dem letzten Element vertauscht. Damit kann es einfach zurückgegeben werden.

In [3]:
class MaxPQUnorderedArray:
    
    def __init__(self):
        self._data = []
    
    def insert(self, k):
        self._data.append(k)
    
    def max(self):
        self._largestToEnd()
        return self._data[-1]
            
    def delMax(self):
        self._largestToEnd()
        return self._data.pop()
    
    def _largestToEnd(self):
        if len(self._data) == 0:
            return
        
        maxElem = self._data[0]            
        maxIndex = 0
        for i, d in enumerate(self._data):
            if (maxElem < d):
                maxElem = self._data[i]
                maxIndex = i
        self._data[maxIndex], self._data[-1] = self._data[-1], self._data[maxIndex]
        
    
        
    def isEmpty(self):
        return len(self._data) == 0
    
    def size(self):
        return len(self._data)

#### Implementation mit sortiertem Array

In dieser zweiten Implementation, passiert die Hauptarbeit in der Methode ```insert```. Unsere Implementation stellt sicher, dass das neue Element jeweils an die richtige Position im Array eingefügt wird. Im Vergleich zur vorherigen Methode, sind dafür die Methoden ```max``` und ```delMax``` sehr effizient.

In [6]:
class MaxPQOrderedArray:
    
    def __init__(self):
        self._data = []
    
    def insert(self, k):
        
        # Suche im sortierten Array data die Position vom neuen Element
        idx = 0
        while (idx < len(self._data) and self._data[idx] < k):            
            idx += 1
        self._data.insert(idx, k)        
        
    def max(self):
        if self.isEmpty():
            return None
        else:
            return self._data[-1]
            
    def delMax(self):
        return self._data.pop()
        
        
    def isEmpty(self):
        return len(self._data) == 0
    
    def size(self):
        return len(self._data)

#### Komplexität

In [7]:
import timeit
import random

In [8]:
def insertNElements(pq, N):
    for i in range(0, N):
        pq.insert(i)


In [9]:
def removeLargestNElements(pq, N):
    for i in range(0, N):
        pq.delMax()

In [10]:
orderedPQ = MaxPQOrderedArray()
unorderedPQ = MaxPQUnorderedArray()

print("insert ordered ", timeit.timeit(lambda: insertNElements(orderedPQ, 10000), number = 1))
print("insert unordered", timeit.timeit(lambda: insertNElements(unorderedPQ, 10000), number = 1))
print("removeLargest ordered", timeit.timeit(lambda: removeLargestNElements(orderedPQ, 10000), number = 1))
print("removeLargest unordered", timeit.timeit(lambda: removeLargestNElements(unorderedPQ, 10000), number = 1))

insert ordered  12.607942199974786
insert unordered 0.0035909999860450625
removeLargest ordered 0.002757200039923191
removeLargest unordered 6.965862900018692


## Beispiel Client

Eine typische Beispielanwendung ist, dass man aus einem sehr grossen Datenstrom die grössten Elemente extrahieren möchte. Um das Beispiel hier minimal zu halten, und trotzdem die Möglichkeit zu haben grosse Streams zu generiern, ziehen wir Zufallszahlen von einer Normalverteilung.

Die folgende Funktion generiert einen Stream von $n$ normalverteilen Zufallszahlen

In [6]:
import random

def numberGen(n):
    num = 0
    while num < n:
        yield random.normalvariate(0, 1)
        num += 1

#### Übung:

Schreiben Sie einen Client, der eine Priority Queue nutzt um die M grössten Elemente aus dem Stream von Daten zu extrahieren und auszugeben.

In [7]:
def printLargestNumber(M, N):
    pq = MaxPQUnorderedArray()
    for number in numberGen(N):
        pass ## do something with the numbers which are generated

In [None]:
printLargestNumber(10, 10000000)