giovedì 28 marzo 2013


SIMILARITY è venuto al mondo.

Si tratta di un’applicazione concettualmente rivoluzionaria che consente all’utente finale di individuare, in due o tre passaggi, tra migliaia, una o più persone con delle caratteristiche ben chiare.
Dal punto di vista del social network col quale viene fatto l’agremeent, il social network deve:



1)  Fornire su un foglio Excel le caratteristiche di un massimo di 60 mila persone. Eventualmente questo gruppo si chiamerà gruppo A, altre 60 mila si chiameranno gruppo B eccetera.
2)  Per ogni persona sono fornite (ad esempio) anno di nascita, peso, statura, sesso, istruzione, ultimi 10 lavori effettuati e quanto si vuole. Oppure dei codici non spiegati (la spiegazione in realtà non serve). Tutte le variabili qualitative dovranno essere trasformate in variabili quantitative e dall’autore verrà eventualmente spiegato come. Anche l’elenco delle caratteristiche può essere eventualmente discusso con l’autore.
3)  Ogni persona è individuata nel foglio Excel esclusivamente con un numero di matricola che va da uno a 60 mila (per rimanere nell’esempio precedente). Il software non ha bisogno nel modo più assoluto di dati sensibili, come nome, cognome eccetera. I dati sensibili rimangono presso il social network, il quale in seguito reperirà i dati sensibili in base al codice assegnato sul foglio Excel. In buona sostanza, col foglio Excel deve essere impossibile risalire ai dati sensibili dei 60 mila interessati.
4)  L’indirizzo può essere utile, magari in modo approssimato, ad esempio Milano (oppure l’area), ma non certo la via eccetera.
5)  Eventuale fotografia non ci deve essere, al massimo si può utilizzare un software che classifica la bocca in una colonna, gli occhi in un’altra, il naso... desumendoli dalla foto che rimane presso il social network.
6)  Il social network decide in quante categorie suddividere le sessantamila persone. Ad esempio 80 categorie, oppure 40 categorie. Anche questo viene concordato con l’autore e può essere modificato anche in seguito, a seconda delle esigenze e delle esperienze che via via il social network andrà maturando. All’inizio con qualche piccolo esperimento ci si renderà conto del tutto.
7)  Ogni giorno il social network potrà depennare immediatamente la riga (ad esempio) 41512 perché tale persona non vuole più partecipare e quindi il 41512 non comparirà più, come vedremo sotto.
8)  Ogni settimana possono essere aggiunte altre righe, sino alla capienza del foglio Excel (64000 circa).


Dal punto di vista dell’autore:
1)  Il foglio Excel viene opportunamente analizzato e per ogni riga viene posto il codice di categoria assegnato. Il software può suddividere gli individui elencati anche in un numero di categorie inferiori a quanto stabilito dal social network. Se ad esempio le categorie stabilite fossero state 40, la risposta dei computers potrebbe contemplare non più di 38 categorie. Esemplificando, se il primo individuo della riga 1 è stato assegnato alla categoria 23 e il secondo individuo è stato assegnato alla categoria 15, il social network riceverà dopo un paio di giorni un file con i seguenti dati:   1 – 23, 2 – 15.
2)  Primamente si crea un software di analisi, come vedremo qui sotto.

Dal punto di vista dell’utente finale:
1)  Appare una schermata sul desktop dove ci sono, nei tre quarti superiori dello schermo, una quarantina di fotografie, una per ogni categoria col numero di matricola assegnato (da 1 a 60000)
2)  Facendo scorrere il mouse sopra una delle 40 fotografie, compare nel quarto inferiore di schermo una descrizione del soggetto relativo, con città, età, professione eccetera: una evidenziazione delle colonne di tale riga. Le 40 fotografie iniziali sono, ripetiamo, in rappresentanza delle 40 categorie.
3)  L’utente esegue un click su una delle 40 fotografie e quindi compaiono altre 40 fotografie, questa volta tutte della stessa categoria.
4)  A questo punto l’utente può richiedere di sostituire le foto con altre (se ci sono) più affini ai suoi desideri: questo dipende anche da come il software ha creato le categorie e da quali colonne ci sono a disposizione; se ad esempio una colonna di tale categoria è Milano e solamente Milano, è inutile cercare città diverse perché quella categoria è composta solo di abitanti a Milano. Una richiesta potrebbe essere ‘tutti quelli che hanno più di 25 anni’, a patto che nella categoria ci siano, nella colonna dell’età, valori diversi: potrebbe darsi benissimo che la categoria voluta abbia tutti componenti al di sotto dei 22 anni.

Considerazioni generali:

1)  Il sistema può avere uno o più scopi dichiarati o addirittura non averne. Uno scopo può essere una ricerca per un lavoro, un altro scopo per creare un club e così via.
2)  Il sistema di classificazione è puro, multidimensionale e non ha alcuna relazione con lo scopo per il quale il social network ha messo a disposizione l’applicazione.
3)  A seconda delle necessità del social network, si possono vedere delle applicazioni particolari.
4)  Si prevede un buon successo sperimentale: l’esperimento può essere condotto con non meno di 400 elementi (righe).
5)  Il numero delle categorie dipende molto dall’omogeneità dei dati: in linea di massima non si possono chiedere più della radice quadrata del numero degli elementi. Nel caso di 400, non più di venti categorie. Il numero delle colonne non dovrebbe superare il doppio del numero delle categorie. La condizione migliore è quando le categorie trovate dal computer sono inferiori a quelle massime previste. (Ne ho chieste 40, il computer ne ha trovate 38. Potrei allora ridurre ad esempio a 36 e rifare il processo, per dare maggiore corposità a tutto il data base.)
6)  Le categorie possono cambiare a seconda del contesto. Il colore dei capelli (che può essere classificato da 1 a 10 partendo dal più chiaro per finire col più scuro) non è probabilmente necessario per individuare lavoratori a domicilio, eccetera.
7)  Un analogo sistema può essere usato per delle automobili usate, per delle località di villeggiatura, crociere, per case in affitto e/o in vendita, per biblioteche: ad esempio case di villeggiatura in Italia offerte ai cittadini di altri paesi, col social network protagonista, che può accordarsi con operatori specializzati (ad esempio per le crociere)

ernesto.giorgi@gmail.com

Nessun commento:

Posta un commento

Commenti o richiesta di chiarimenti.