# Introduzione a Python 4/4

19 Febbraio 2024

## Argomenti

1. Moduli
1. File esterni


## Moduli

Le funzioni e i tipi inclusi nel nucleo di Python sono insufficienti per molte applicazioni.

La struttura di Python permette quindi di includere moduli aggiuntivi che, di norma, si aggiungono all'inizio del notebook.

Per esempio, il modulo `string` contiene delle costanti e delle stringhe di utilità nella manipolazione dei testi

Il modulo è parte della Standard Library ed è descritto [qui](https://docs.python.org/3/library/string.html#module-string)

Per importare un modulo nel notebook si usa l'struzione `import`.

In [None]:
string.ascii_letters

In [None]:
import string


Un modo equivalente per ottenere questo risultato è il seguente

In [None]:
lettere = string.ascii_letters
print(lettere)

segni_interpunzione = string.punctuation
print(segni_interpunzione)

caratteri_invisibili = string.whitespace
print(caratteri_invisibili)

In pratica, un modulo è un pezzo di codice contenuto in un file che definisce dei nuovi tipi di dati e delle funzioni. L'importazione rende possibile richiamare tutti gli oggetti contenuti nel file esterno semplicemente mettendo come prefisso il nome del modulo.

Un altro esempio è il modulo `datetime` che viene utilizzato per gestire dati relativi a date e tempi.

In [None]:
import datetime as dt

Nella sintassi qui sopra, `as` introduce un sinonimo per il modulo. In pratica, invece di scrivere ogni volta `datetime.` si potrà scrivere `dt.`.



In [None]:
adesso = dt.datetime.now()
print(adesso)

In [None]:
type(adesso)

In [None]:
print(adesso.strftime("%a %d %b %Y"))

Infine, c'è il modulo `math` che contiene le principali funzioni matematiche.

In [None]:
import math

a = 9
b = math.sqrt(a)
print(f'La radice quadrata di {a} è {b}.')

Di solito, per le analisi scientifiche, si usano moduli più complessi, `numpy`, `scipy`, che saranno introdotti successivamente.

# Lavorare con i file esterni

I testi da analizzare sono contenuti in file esterni. Per esempio, nel file `alice.txt` è contenuto il testo di Alice in Wonderland.

Per esaminare il file occorre renderlo disponibile a Python. Questo si fa nel modo seguente.
```python
with open('alice.txt', 'r') as file_input:
```

In generale, la sintassi è
```python
with open(<nome del file>, <tipo_di_collegamento>) as <nome_variabile>:
```

dove:
- `<nome del file>` è il nome del file nel sistema
- `<tipo di collegamento>` è una stringa. Ad es:`"r"` sta per `read`, `"w"` sta per write
- `<nome variabile` è il nome che si vuole assegnare alla variabile con cui si lavorerà in seguito, come se si lavorasse con il file.

In [None]:
# from google.colab import drive
# drive.mount('/content/drive')
with open('/content/drive/My Drive/Colab Notebooks/alice_chapter1.txt', 'r', encoding='utf-8') as file_input:
  # everything = file_input.read()
  for line in file_input:
    print(line)


CHAPTER I.

Down the Rabbit-Hole





Alice was beginning to get very tired of sitting by her sister on the

bank, and of having nothing to do: once or twice she had peeped into

the book her sister was reading, but it had no pictures or

conversations in it, “and what is the use of a book,” thought Alice

“without pictures or conversations?”



So she was considering in her own mind (as well as she could, for the

hot day made her feel very sleepy and stupid), whether the pleasure of

making a daisy-chain would be worth the trouble of getting up and

picking the daisies, when suddenly a White Rabbit with pink eyes ran

close by her.



There was nothing so _very_ remarkable in that; nor did Alice think it

so _very_ much out of the way to hear the Rabbit say to itself, “Oh

dear! Oh dear! I shall be late!” (when she thought it over afterwards,

it occurred to her that she ought to have wondered at this, but at the

time it all seemed quite natural); but when the Rabbit actually _took 

Il nome della variabile assegnato al file (in inglese, *file handle*) si comporta come un *iterator*. Analogamente alle liste, alle stringhe, ai range, se compare all'interno di un ciclo `for` restituisce una linea alla volta fino alla fine del file.

In [None]:
with open('/content/drive/My Drive/Colab Notebooks/alice_chapter1.txt', 'r', encoding='utf-8') as file_input:
    for line in file_input:
        print(line.strip())




CHAPTER I.
Down the Rabbit-Hole


Alice was beginning to get very tired of sitting by her sister on the
bank, and of having nothing to do: once or twice she had peeped into
the book her sister was reading, but it had no pictures or
conversations in it, “and what is the use of a book,” thought Alice
“without pictures or conversations?”

So she was considering in her own mind (as well as she could, for the
hot day made her feel very sleepy and stupid), whether the pleasure of
making a daisy-chain would be worth the trouble of getting up and
picking the daisies, when suddenly a White Rabbit with pink eyes ran
close by her.

There was nothing so _very_ remarkable in that; nor did Alice think it
so _very_ much out of the way to hear the Rabbit say to itself, “Oh
dear! Oh dear! I shall be late!” (when she thought it over afterwards,
it occurred to her that she ought to have wondered at this, but at the
time it all seemed quite natural); but when the Rabbit actually _took a
watch out of its w

Il metodo `read()` legge tutto il file in una stringa. Non conviene usarlo!

In [None]:
with open('/content/drive/My Drive/Colab Notebooks/alice_chapter1.txt', 'r', encoding='utf-8') as file_input:
    all_text = file_input.read()

print(len(all_text))

11420


Come si vedrà nel seguito, molte delle manipolazioni sui file contenenti i dati sono fatte con strumenti specifici e dall'uso relativamente semplice.

### Esercizio

Il file `alice_chapter1.txt` contiene il primo capitolo del libro.

Scrivere un breve programma che stampa solo le linee che contengono la parola *Alice*.

In [None]:
# with open('/content/drive/My Drive/Colab Notebooks/alice_chapter1.txt', 'r', encoding='utf-8') as file_input:
#    for line in file_input:
#        if 'Alice' in line:
#            print(line.strip())

with open('/content/drive/My Drive/Colab Notebooks/alice_chapter1.txt', 'r', encoding='utf-8') as file_input:
  # costruire una lista con tutte le righe che contengono Alice
  lista_righe_con_Alice = [line for line in file_input if 'Alice' in line]

print(lista_righe_con_Alice)


['Alice was beginning to get very tired of sitting by her sister on the\n', 'conversations in it, “and what is the use of a book,” thought Alice\n', 'There was nothing so _very_ remarkable in that; nor did Alice think it\n', 'on, Alice started to her feet, for it flashed across her mind that she\n', 'In another moment down went Alice after it, never once considering how\n', 'dipped suddenly down, so suddenly that Alice had not a moment to think\n', '“Well!” thought Alice to herself, “after such a fall as this, I shall\n', 'be four thousand miles down, I think—” (for, you see, Alice had learnt\n', 'then I wonder what Latitude or Longitude I’ve got to?” (Alice had no\n', 'Down, down, down. There was nothing else to do, so Alice soon began\n', 'Alice began to get rather sleepy, and went on saying to herself, in a\n', 'Alice was not a bit hurt, and she jumped up on to her feet in a moment:\n', 'it. There was not a moment to be lost: away went Alice like the wind,\n', 'Alice had been all th