# Arrays und Verkettete Listen

## Arrays

### Arrays in Python

Arrays in Python sind durch den Datentyp ```List``` implementiert. Im Gegensat zu den Java Arrays, die eine fixe Grösse haben, kann ```List``` dynamisch wachsen.

#### Erzeugen von Arrays

Folgende Aufrufe illustrieren verschiedene Möglichkeiten ein Array in Python zu erzeugen.

Ein Array kann kreiert werden, indem die Elemente zwischen eckigen Klammern [] geschrieben werden. Hier wird ein leeres Array erstellt:

In [None]:
[]

Und hier ein Array mit 4 Elementen:

In [None]:
["a", "list", "of", "strings"]

Zur Initialisierung ist es häufig nützlich, den Eintrag einer Liste $n$ mal wiederholen zu können.

In [None]:
[None] * 10

#### Elemente lesen und setzten

In [None]:
xs = ["a", "b", "c", "d"]

Lesen und setzen von Elementen passiert via dem [] Operator. Hier lesen wir das erste Element:

In [None]:
print(xs[0])

Wenn der Index negativ ist, wird vom Ende gezählt:

In [None]:
print(xs[-1])

Hier wird dem dritte Element der Wert "c'" zugewiesen:

In [None]:
xs[2]="c'"
print(xs)

### Einfügen und erweitern und löschen

Mittels insert und append können neue Elemente zum Array hinzugefügt werden.

In [None]:
xs.insert(2, "bb")
print(xs)

In [None]:
xs.append("dd")
print(xs)

Um ein Element vom Ende zu löschen, verwenden wir die Funktion ```pop```:

In [None]:
xs.pop()
print(xs)

 Um ein Element an einer beliebigen Position zu löschen, kann der Methode ```pop``` der Index mitgegegeben werden:

In [None]:
xs.pop(1)
print(xs)

### Elemente finden

Ob ein Element existiert kann mittels dem "in" operator ermittelt werden. Den Index eines Elements erhält man via der Methode Index. 

In [None]:
"a" in xs

In [None]:
"b" in xs

In [None]:
xs.index("a")

### Laufzeit Versuche

Im folgenden messen wir die Laufzeit der verschiedenen Operationen für Arrays von wachsender Grösse

In [None]:
import timeit
import random

In [None]:
def createArrays():
    return [ [0]*(10**i) for i in range(1, 8)]

In [None]:
def accessArray(a):
    r = random.randint(0, len(a)-1)
    a[r] = 10
    

In [None]:
def findInArray(a):
   c = "you wont find me" in a

In [None]:
def appendToArray(a):
    for i in range(0, 10000):
        a.append(1)

In [None]:
def insertIntoArray(a):
    a.insert(0, "newElement")

In [None]:
for array in createArrays():
    print(timeit.timeit(lambda: accessArray(array), number=100000))

In [None]:
for array in createArrays():
    print(timeit.timeit(lambda: findInArray(array), number=100))

In [None]:
for array in createArrays():
    print(timeit.timeit(lambda: appendToArray(array), number=100))

In [None]:
for array in createArrays():
    print(timeit.timeit(lambda: insertIntoArray(array), number=1000))

#### Speicherkomplexität

*Achtung*: Der Befehl getsizeof funktioniert nur für primitive Datentypen (int, ...)

In [None]:
import sys
for array in arrays:
    print(sys.getsizeof(array))

### Ammortisierte Analyse: Array resizing

Der folgende Code dient zum Illustrieren der Ammortisierten Komplexität der resize Operation. Wir simulieren ein Array in Python, mit den Operationen append und resize. Wenn immer wir append aufrufen, müssen wir Tokens bezahlen. Von diesen Tokens können wir dann die resize Operation "bezahlen".

#### Übung:

Instrumentieren Sie den Code wie folgt: Für jeden Array Zugriff in der Methode resize muss ein Token bezahlt werden. Für jeden ```append``` call müssen Sie eine Anzahl Tokens "auf die Seite legen".  Wieviele Tokens müssen wir pro append "auf die Seite legen", dass wir immer für die resize Operation bezahlen können (also die Anzahl Tokens immer positiv ist?)

In [None]:
class  Array:

    def __init__(self):
        self.data = [None] # list  simulates  block  of  memory
        self.lastIdx = 0
        self.tokens = 0
        
    def append(self, elem):
        if self.lastIdx == len(self.data):            
            self.resize(len(self.data) * 2)
        self.data[self.lastIdx] = elem
        self.lastIdx  += 1        
    
    def  resize(self, numElements ):
        print("resizing from %d to %d"%(len(self.data), numElements))
        print("number of tokens before resizing " + str(self.tokens))
        newArray = [None] * numElements

        for i in  range(0, len(self.data )):            
            newArray[i] = self.data[i]
        self.data = newArray
        print("number of tokens after resize " +str(self.tokens))
        
    
    def __str__(self):
        return str(self.data)
    
    def length(self):
        return self.lastIdx


Wir testen die Methode durch wiederholtes Aufrufen der append Funktion. 
Wir sehen, dass in unserer Implementation, die methode resize nicht bei jedem ```append``` Call aufgerufen wird. 

In [None]:
a = Array()
for i in range(0, 128):
    a.append(i)
print(a.length())

# Verkettete Listen

### Interne Implementation mit der Klasse Node

Die Grundlage für die Implementation ist ein Node. Ein Node enthält ein Datum (hier item genannt) und eine Referenz auf das nächste Element (oder None, falls es kein nächstes Element gibt)

In [None]:
class Node:
    def __init__(self, item, next=None):
        self.item = item
        self.next = next    

Bevor wir mit dieser Datenstruktur experimentieren, brauchen wir eine Methode, die uns die Liste anzeigt. 

In [None]:
def printList(n):
    currentNode = n
    while (currentNode != None):
        print(currentNode.item)
        currentNode = currentNode.next

Ale erstes erzeugen wir 3 Knoten 

In [None]:
n1 = Node("first")
n2 = Node("second")
n3 = Node("third")

Wie wir mit printList sehen, ist jedes Element noch einzeln.

In [None]:
printList(n1)

Um eine Liste von 3 Elementen zu erhalten müssen wir diese noch verketten.

In [None]:
n1.next = n2; n2.next = n3
printList(n1)

Wir können jetzt weitere Funktionen schreiben um mit der Liste zu arbeiten, wie zum Beispiel ein Element am Anfang hinzuzufügen

In [None]:
def addItemToBegin(item, node):
    newNode = Node(item, node)
    return newNode

In [None]:
printList(addItemToBegin("before first", n1))

## Implementieren eines Listen ADTs

Direkt mit der Klasse Node zu arbeiten funktiont für interne Implementationen, wäre aber für einen Endbenutzer zu Mühsam. Eine bessere Strategie ist es, einen Listen ADT zu designen, und diesen dann, zum Beispiel mit einer verketteten Liste zu implementieren. 
Wir zeigen hier schematisch, wie so eine Implementation aussehen kann.

In [None]:
class LinkedList:
    
    
    class Iterator:        
        def __init__(self, linkedList):
            self._currentItem = linkedList.head
            self.linkedList = linkedList
        
        def hasNext(self):    
            return (self._currentItem != None)
    
        def next(self):            
            item = self._currentItem.item
            self._currentItem = self._currentItem.next
            return item

        
    def iterator(self):
        return LinkedList.Iterator(self)   
    
    def __init__(self):
        self.head = None
  
    def addFirst(self, item):         
        newNode = Node(item, self.head)        
        self.head = newNode
        
    def append(self, item):
        raise NotImplementedError()
    
    def removeFirst(self):
        raise NotImplementedError()
    
    def print(self):        
        currentNode = self.head
        while (currentNode != None):
            print(currentNode.item, end=" ")
            currentNode = currentNode.next


*Übung: Implementieren Sie die fehlenden Methoden!*

Dank dieses ADTs ist es nun sehr einfach die Liste zu benutzen.

In [None]:
l = LinkedList()
l.addFirst("last")
l.addFirst("second")
l.addFirst("first")
l.print()

In [None]:
it =l.iterator()

In [None]:
while (it.hasNext()):    
    print(it.next())

### Rekursive Implementation

Wir können eine Liste auch als rekursive Datenstruktur interpretieren. Die Definition ist grundsätzlich dieselbe wie bei der Klasse Node. Um die rekursive Struktur klarer zu machen, führen wir hier jedoch eine neue Klasse ein, die die Intention klarer macht. 

In [None]:
class LList:
    def __init__(self, head, tail):
        self.head = head
        self.tail = tail       

Die einfachste Instanz der rekursiven Liste ist die Leere Liste, die wir wir folgte definieren

In [None]:
emptyList = LList(None, None)

Eine etwas kompliziertere Liste lässt sich einfach durch Schachtelung konstruieren.

In [None]:
l = LList("first", LList("second", LList("third", emptyList)))

Die rekursive Definitionführt zu einer sehr natürlichen, rekursiven, Implementation der Operationen. Der Code folgt einfach der Struktur die durch die Datenstruktur vorgegeben ist. 

#### Übung: 
Implementieren Sie rekursive Operationen für ```printList``` und ```append``` (am Ende einfügen). Die ```append``` operation soll eine neue Liste mit einem neuen Element zurückgeben.