SIMILARITY è venuto al mondo.
Si tratta di un’applicazione concettualmente
rivoluzionaria che consente all’utente finale di individuare, in due o tre
passaggi, tra migliaia, una o più persone con delle caratteristiche ben chiare.
Dal punto di vista del social network col quale
viene fatto l’agremeent, il social network deve:
1) Fornire
su un foglio Excel le caratteristiche di un massimo di 60 mila persone. Eventualmente
questo gruppo si chiamerà gruppo A, altre 60 mila si chiameranno gruppo B eccetera.
2) Per
ogni persona sono fornite (ad esempio) anno di nascita, peso, statura, sesso,
istruzione, ultimi 10 lavori effettuati e quanto si vuole. Oppure dei codici
non spiegati (la spiegazione in realtà non serve). Tutte le variabili
qualitative dovranno essere trasformate in variabili quantitative e dall’autore
verrà eventualmente spiegato come. Anche l’elenco delle caratteristiche può
essere eventualmente discusso con l’autore.
3) Ogni
persona è individuata nel foglio Excel esclusivamente con un numero di
matricola che va da uno a 60 mila (per rimanere nell’esempio precedente). Il
software non ha bisogno nel modo più assoluto di dati sensibili, come nome,
cognome eccetera. I dati sensibili rimangono presso il social network, il quale
in seguito reperirà i dati sensibili in base al codice assegnato sul foglio
Excel. In buona sostanza, col foglio Excel deve essere impossibile risalire ai dati
sensibili dei 60 mila interessati.
4) L’indirizzo
può essere utile, magari in modo approssimato, ad esempio Milano (oppure l’area),
ma non certo la via eccetera.
5) Eventuale
fotografia non ci deve essere, al massimo si può utilizzare un software che
classifica la bocca in una colonna, gli occhi in un’altra, il naso...
desumendoli dalla foto che rimane presso il social network.
6) Il
social network decide in quante categorie suddividere le sessantamila persone.
Ad esempio 80 categorie, oppure 40 categorie. Anche questo viene concordato con
l’autore e può essere modificato anche in seguito, a seconda delle esigenze e
delle esperienze che via via il social network andrà maturando. All’inizio con
qualche piccolo esperimento ci si renderà conto del tutto.
7) Ogni
giorno il social network potrà depennare immediatamente la riga (ad esempio) 41512
perché tale persona non vuole più partecipare e quindi il 41512 non comparirà
più, come vedremo sotto.
8) Ogni
settimana possono essere aggiunte altre righe, sino alla capienza del foglio
Excel (64000 circa).
Dal punto di vista dell’autore:
1) Il
foglio Excel viene opportunamente analizzato e per ogni riga viene posto il
codice di categoria assegnato. Il software può suddividere gli individui
elencati anche in un numero di categorie inferiori a quanto stabilito dal
social network. Se ad esempio le categorie stabilite fossero state 40, la
risposta dei computers potrebbe contemplare non più di 38 categorie.
Esemplificando, se il primo individuo della riga 1 è stato assegnato alla
categoria 23 e il secondo individuo è stato assegnato alla categoria 15, il
social network riceverà dopo un paio di giorni un file con i seguenti dati: 1 – 23, 2 – 15.
2) Primamente
si crea un software di analisi, come vedremo qui sotto.
Dal punto di vista dell’utente finale:
1) Appare
una schermata sul desktop dove ci sono, nei tre quarti superiori dello schermo,
una quarantina di fotografie, una per ogni categoria col numero di matricola
assegnato (da 1 a 60000)
2) Facendo
scorrere il mouse sopra una delle 40 fotografie, compare nel quarto inferiore
di schermo una descrizione del soggetto relativo, con città, età, professione
eccetera: una evidenziazione delle colonne di tale riga. Le 40 fotografie
iniziali sono, ripetiamo, in rappresentanza delle 40 categorie.
3) L’utente
esegue un click su una delle 40 fotografie e quindi compaiono altre 40
fotografie, questa volta tutte della stessa categoria.
4) A
questo punto l’utente può richiedere di sostituire le foto con altre (se ci
sono) più affini ai suoi desideri: questo dipende anche da come il software ha
creato le categorie e da quali colonne ci sono a disposizione; se ad esempio
una colonna di tale categoria è Milano e solamente Milano, è inutile cercare
città diverse perché quella categoria è composta solo di abitanti a Milano. Una
richiesta potrebbe essere ‘tutti quelli che hanno più di 25 anni’, a patto che
nella categoria ci siano, nella colonna dell’età, valori diversi: potrebbe
darsi benissimo che la categoria voluta abbia tutti componenti al di sotto dei
22 anni.
Considerazioni generali:
1) Il
sistema può avere uno o più scopi dichiarati o addirittura non averne. Uno
scopo può essere una ricerca per un lavoro, un altro scopo per creare un club e
così via.
2) Il
sistema di classificazione è puro, multidimensionale e non ha alcuna relazione
con lo scopo per il quale il social network ha messo a disposizione l’applicazione.
3) A
seconda delle necessità del social network, si possono vedere delle
applicazioni particolari.
4) Si
prevede un buon successo sperimentale: l’esperimento può essere condotto con
non meno di 400 elementi (righe).
5) Il
numero delle categorie dipende molto dall’omogeneità dei dati: in linea di
massima non si possono chiedere più della radice quadrata del numero degli
elementi. Nel caso di 400, non più di venti categorie. Il numero delle colonne
non dovrebbe superare il doppio del numero delle categorie. La condizione
migliore è quando le categorie trovate dal computer sono inferiori a quelle
massime previste. (Ne ho chieste 40, il computer ne ha trovate 38. Potrei
allora ridurre ad esempio a 36 e rifare il processo, per dare maggiore
corposità a tutto il data base.)
6) Le
categorie possono cambiare a seconda del contesto. Il colore dei capelli (che
può essere classificato da 1 a 10 partendo dal più chiaro per finire col più
scuro) non è probabilmente necessario per individuare lavoratori a domicilio,
eccetera.
7) Un
analogo sistema può essere usato per delle automobili usate, per delle località
di villeggiatura, crociere, per case in affitto e/o in vendita, per
biblioteche: ad esempio case di villeggiatura in Italia offerte ai cittadini di
altri paesi, col social network protagonista, che può accordarsi con operatori
specializzati (ad esempio per le crociere)
ernesto.giorgi@gmail.com
Nessun commento:
Posta un commento
Commenti o richiesta di chiarimenti.