# Introduzione a Python 1/4

2 Febbraio 2024

## Argomenti

1. L'ambiente COLAB di Google
2. I notebook
3. ...

## L'ambiente COLAB di Google

[https://colab.research.google.com/](https://colab.research.google.com/)

## Notebook

Ambiente integrato che permette di inserire testo e codice.

Un notebook è strutturato in **Celle" che possono contenere testo, codice, o sequenze di caratteri non altrimenti interpretate.

### Testo

Il testo è interpretato nella codifica MARKDOWN: [https://en.wikipedia.org/wiki/Markdown](https://en.wikipedia.org/wiki/Markdown)

Markdown permette di scrivere rapidamente testo con minimi elementi di formattazione (grassetto, corsivo, elenchi puntati, ecc.)

In un notebook, il tipo di cella (markdown, code o raw) determina la visualizzazione.

## Esempi

# Titolo

## Sottotitolo

### Sottosottotitolo

Testo generico: **evidenziato forte**, *evidenziato debole*, matematica $x+y=\sqrt{2}$

Elenchi puntati:
- una cosa
- un'altra cosa
- delle altre cose
  - altre cose importanti
  - altre cose meno importanti

Elenchi numerati:
1. primo
2. secondo
3. terzo
   1. terzo/1
   2. terzo/2


Caratteri non proporzionali `utili per scrivere pezzi di codice nel testo`

Per scrivere pezzi lunghi di codice
```python
def successivo(num):
    return num + 1
```
e si vede che è codice

Citazioni

>CHAPTER I
>
>Down the Rabbit-Hole
>
>Alice was beginning to get very tired of sitting by her sister on the bank, and of having nothing to do: once or twice she had peeped into the book her sister was reading, but it had no pictures or conversations in it, `and what is the use of a book,' thought Alice `without pictures or conversation?'

## Muoversi e operare con le celle

**Attenzione**: questa sezione dipende dal tipo di ambiente. Colab ha i suoi comandi, i Jupyter Notebook ne hanno altri, Visual Studio Code ne ha altri ancora.

`X` = cut, `V` = paste below, `C` = copy, `DD` = cancella, e molti altri dal menù Edit

`Enter` permette la modifica del contenuto della cella

`Shift + Enter` esegue il contenuto della cella (il markdown viene applicato, il codice viene eseguito) e passa alla cella successiva

`Ctrl + M + M` cambia la cella in Markdown

`Ctrl + M + Y` cambia la cella in codice

`Ctrl + S` salva il notebook

In [None]:
x=3

In [None]:
x

3

In [None]:
print(f'2+2={2+2}')

2+2=4


# Introduzione a Python

Un *programma per computer* è un insieme organizzato di istruzioni, scritte in un *linguaggio di programmazione*, che sono pensate per essere eseguite da un computer.

I linguaggi di programmazione sono definiti da grammatiche specifiche, come i linguaggi naturali. E come i linguaggi naturali hanno caratteristiche che li accomunano e che li differenziano. Per questo alcuni linguaggi sono più adatti di altri a fare certe cose.

In generale, i linguaggi di programmazione sono di *basso livello*, nel senso che le loro grammatiche definiscono operazioni semplici, elementari, mentre lo svolgimento di operazioni più complesse è affidato ai *programmi* che, appunto, raggruppano e organizzano in modo coerente tali operazioni elementari.

I linguaggi come Python sono detti *general purpose* perché le loro istruzioni *non* sono orientate allo svolgimento di alcun compito in particolare.

Python, come alcuni linguaggi di programmazione è *orientato agli oggetti*. Un *oggetto* è un'entità che ha delle *proprietà* (attributes, in Python) e che può svolgere delle operazioni, dette *metodi* (methods).

Python, come molti altri linguaggi general purpose, ha una struttura costituita da:
- un nucleo che definisce alcuni elementi base del linguaggio e alcuni programmi di utilità
- delle *libraries* aggiuntive che si distinguono in:
    - standard (perché presenti in tutte le installazioni di Python)
    - non standard (disponibli su Internet)

Installando Python sul proprio computer, scaricandolo da [https://www.python.org/](https://www.python.org/), si ottiene il nucleo e la standard library, ma non, ovviamente, tutte le libraries aggiuntive, che vanno installate una per una, a seconda delle necessità.

Anche i programmi che permettono di creare, modificare, eseguire notebook, sono essi stessi costituiti da libraries aggiuntive.

Questo è il motivo per cui usiamo colab. Nell'ambiente colab, Google ha reso disponibile Python, il software per gestire i notebook e, se servono, tutte le librerie aggiuntive per la manipolazione e l'analisi dei testi. Lo "svantaggio" è che l'ambiente è remoto, e gestito da Google.


## Variabili

In molti linguaggi, gli oggetti che un programma manipola si chiamano *variabili*. La documentazione di Python preferisce, più correttamente, il nome *data-type* come sinonimo di *oggetto*.

Python fornisce molti *built-in* data-types, come numeri, stringhe, liste, dizionari, tuple. Come molti linguaggi, Python inoltre permette all'utente di definire anche nuovi data-types.

### Built-in data-types

La lista completa è [qui](https://docs.python.org/3/library/stdtypes.html)

Per creare un dato occorre dargli:
- un nome (*il nome della variabile*)
- il tipo (*il data-type*)

Questo si fa quasi sempre con l'operatore `=` che rappresenta l'assegnazione. L'istruzione `x = y` viene interpretato così:
1. il valore sulla destra del segno `=`, cioè `y` viene valutato (se si tratta di un'espressione) o semplicemente preso così com'è (se è un numero, una sequenza di caratteri tra apostrofi o virgolette, o altro)
2. viene presa una locazione di memoria e il contenuto di `y` viene inserito in quella locazione
3. viene creato un collegamento, simbolico, tra il nome, `x`, e la locazione di memoria

**IMPORTANTE**: il segno di uguale _non_ rappresenta un confronto tra l'espressione di destra e quella di sinistra.

Il nome, `x`, può essere una qualsiasi sequenza di caratteri a-z, A-Z, 0-9, _. **Non può iniziare con un numero**. Python non ha regole per dare i nomi alle variabili, ma chi programma dovrebbe attenersi a due regole:
- dare nomi di variabile che abbiano un significato chiaro
- separare le parole nel nome di variabile con un _

Per esempio, se una variabile deve contenere la data di nascita di una persona, conviene chiamarla `data_di_nascita`, e non `d` (che cos'è d?), `dn` (idem), `nascita` (data o luogo?), ecc. 

La lunghezza del nome rende chiaro a tutti (chi ha scritto il programma e chi lo sta usando, correggendo, ecc.) che cosa si sta facendo e non influisce sulla velocità di esecuzione.


In [1]:
mesi_per_anno = 12

In [2]:
mesi_per_anno

12

Per sapere di che tipo è una certa variabile, si può usare l'istruzione `type`.

In [3]:
type(mesi_per_anno)

int

In [None]:
b = int(5)

In [None]:
type(b)

int

In [None]:
b

5

In [None]:
nome = "Fabrizio"

In [None]:
nome

'Fabrizio'

In [None]:
type(nome)

str

In [1]:
l1 = ['Mozart', 'Beethoven', 'Verdi']

In [2]:
l1

['Mozart', 'Beethoven', 'Verdi']

In [3]:
type(l1)

list

In [4]:
d1 = {'name': 'Fabrizio', 'age': 59}

In [5]:
type(d1)

dict

Il tipo di delimitatore dei caratteri viene interpretato da Python come un'indicazione del tipo di dato:
- `' '` o `" "` per le stringhe
- `[ ]` per le liste
- `{ }` per i dizionari

Si possono usare le istruzioni di costruzione esplicitamente (ma non è frequente)

In [11]:
d2 = dict(primo=1, secondo=2)   # forse controintuitiva ...

In [13]:
d2

{'primo': 1, 'secondo': 2}

## Operazioni sui tipi di dati

### Stringhe (sequenze di caratteri)

Una stringa è una sequenza ordinata di caratteri. I singoli caratteri di una stringa sono numerati a partire da 0. La sintassi è `<nomestringa>[indice]`.

**Le lettere maiuscole non sono uguali alle lettere minuscole.**

In [42]:
s1 = 'Fabrizio'

In [43]:
s1[0]

'F'

In [44]:
s1[3]

'r'

Si possono anche indicare più caratteri usando la sintassi cosiddetta *slicing". 

La sintassi `<nomestringa>[indice_inizio:indice_fine]` rappresenta tutti i caratteri da quello di `indice_inizio` a quello **precedente** `indice_fine`. In questa maniera, la lunghezza della sequenza di caratteri è data dalla differenza tra `indice_inizio` e `indice_fine`.

In [45]:
s1[1:4] # dal secondo al quarto carattere (che ha indice 3)

'abr'

Gli indici possono anche essere negativi!

In [46]:
s1[-1]

'o'

In [47]:
s1[-3:-1]

'zi'

In [48]:
s1[-3:]

'zio'

In [49]:
s1[3:]

'rizio'

In [50]:
s1[:3]

'Fab'

## Operazioni con le stringhe

### Concatenazione

In [2]:
s1 = 'Fabrizio'
s2 = 'Iozzi'
s3 = s1 + s2
s3

'FabrizioIozzi'

In [3]:
s3 = s1 + ' ' + s2

In [4]:
s3

'Fabrizio Iozzi'

### Lunghezza di una stringa

In [5]:
len(s1)

8

In [6]:
len(s3)

14

`len` è un operatore che funziona su diversi elementi, non solo sulle stringhe. Lo vedremo su liste e dizionari

## Metodi delle stringhe

In [7]:
s1

'Fabrizio'

In [8]:
s1.upper()

'FABRIZIO'

I *metodi* sono `funzioni`, nel senso matematico del termine. C'è un input (qualche volta implicito) e c'è un output. Una buona analogia sono le funzioni di Excel. Se nella cella A2 mettiamo la formula `=SOMMA(B1;B3;B4)` la cella A2 conterrà la somma dei contenuti di B1, B3 e B4. B1, B3 e B4 sono gli input e l'output della funzione, che è la somma, viene "restituito" e inserito nella cella A2.

Analogamente, in Python i metodi sono funzioni. Come tali **devono** avere una coppia di parentesi `()`. All'interno delle parentesi c'è l'input della funzione che "restituisce" l'output che produce.

Nel caso precedente, l'input è implicito, perché la funzione viene chiamata con la sintassi `<oggetto>.<metodo>`, e il metodo (che trasforma una stringa nella stessa stringa con tutte maiuscole) agisce sull'oggetto, la stringa `s1`.

In [9]:
s1

'Fabrizio'

La stringa `s1` non è cambiata. La funzione prende il contenuto di `s1` e restituisce la versione maiuscola ma *non c'è nessun oggetto a "raccogliere" il risultato restituito dalla funzione*.

Se si vuole rendere la stringa `s1` tutta maiuscola si può scrivere

In [10]:
s1 = s1.upper()

In [11]:
s1

'FABRIZIO'

oppure si può assegnare il risultato ad un'altra stringa

In [12]:
s1 = 'Fabrizio'
s2 = s1.upper()
s2

'FABRIZIO'

e in questo modo `s1` non viene modificata

In [13]:
s1

'Fabrizio'

### Che cosa si può fare con le stringhe?

Gli oggetti di tipo stringa hanno numerosi metodi. L'elenco completo è [qui](https://docs.python.org/3/library/stdtypes.html#text-sequence-type-str).

Vediamone alcuni.

In [17]:
s3 = "Alice was beginning to get very tired of sitting by her sister on the bank"
s3.find('was')

6

In [18]:
s3.index('h')

52

In [19]:
s3.index('was')

6

I due metodi sono uguali? Praticamente sì. L'unica eccezione è che nel caso in cui la stringa non viene trovata si comportano in modo diverso.

In [20]:
s3.index('Fabrizio')

ValueError: substring not found

In [21]:
s3.find('Fabrizio')

-1

Se serve solo sapere se una stringa è contenuta in un'altra, si può esare `in`, il cui uso è molto frequente in questo e molti altri contesti. `in` restituisce un oggetto di tipo `Boolean`, cioè un valore `Vero` o `Falso`.

In [23]:
'ab' in s3

False

In [24]:
'was' in s3

True

In [28]:
s3.isalpha() # Falso, perché ci sono gli spazi

False

In [29]:
'Fabrizio'.isalpha()

True

In [30]:
s3.replace('a', 'A')

'Alice wAs beginning to get very tired of sitting by her sister on the bAnk'

In [31]:
s3

'Alice was beginning to get very tired of sitting by her sister on the bank'

In [32]:
s3.split()

['Alice',
 'was',
 'beginning',
 'to',
 'get',
 'very',
 'tired',
 'of',
 'sitting',
 'by',
 'her',
 'sister',
 'on',
 'the',
 'bank']

`split` è un metodo che accetta come parametro una stringa da usare come separatore

In [33]:
s3.split('a')

['Alice w',
 's beginning to get very tired of sitting by her sister on the b',
 'nk']

In [34]:
'02-Feb-2024'.split('-')

['02', 'Feb', '2024']

Scrivere `split()` vuol dire *non* indicare il separatore. La funzione manca di un parametro fondamentale e ne definisce uno per *default* (cioè per difetto, mancanza). 

In [35]:
'Fabr    \n    izio'.split()

['Fabr', 'izio']

In [37]:
print('Fabr    \n    izio')

Fabr    
    izio


### Intermezzo: la funzione print

La funzione `print` stampa il contenuto di uno o più oggetti. 

In [38]:
print(3, 'Fabrizio', 4+5)

3 Fabrizio 9


In [41]:
print('Istituto Universitario di Lingue Moderne')

Istituto Universitario di Lingue Moderne


In [40]:
print(f'La stringa s3 contiene: {s3}')

La stringa s3 contiene: Alice was beginning to get very tired of sitting by her sister on the bank


### Il metodo strip

In [8]:
stringa = "\n\nCiao Fabrizio\tIozzi\nSei allo IULM!\n\n"

In [9]:
print('Inizio')
print(stringa)
print('Fine')

Inizio


Ciao Fabrizio	Iozzi
Sei allo IULM!


Fine


In [10]:
print('Inizio')
print(stringa.strip())
print('Fine')

Inizio
Ciao Fabrizio	Iozzi
Sei allo IULM!
Fine


## Hacking London Tube

![Original London Tube](tube_before.jpg)

![London Tube Hacked](tube_after.jpg)

In [None]:
tube_str = "Obstructing the doors causes delay and can be dangerous."
hacker_str1 = tube_str
print(hacker_str1)


Obstruct the doors cause delay and be dangerous.
Obstruct the doors cause delay and anger us.


### Esempio di un tipo di dati definito dall'utente

In [None]:
s1[0]

'F'

In [25]:
class Persona:
    def __init__(self, cognome, nome, anno_di_nascita):
        self.cognome = cognome
        self.nome = nome
        self.anno_di_nascita = anno_di_nascita
    
    def eta(self, anno_corrente):
        return anno_corrente - self.anno_di_nascita

p1 = Persona(cognome='Iozzi', nome='Fabrizio', anno_di_nascita=1964)


In [26]:
p1.cognome

'Iozzi'

In [27]:
p1.nome

'Fabrizio'

In [28]:
p1.eta(2024)

60

`cognome` e `nome` sono metodi del tipo `Persona`. `eta` è un metodo del tipo `Persona`.