Modello per determinare forza di legame (aiuto per tesi di laurea)
Buonasera a tutti. Sto scrivendo la mia tesi di laurea e mi piacerebbe avere un consiglio da voi matematici,ingegneri fisici o non laureati. Sto applicando un algoritmo per il calcolo della forza di legame fra due individui basandomi sui messaggi twitter. Per determinare però se l'elaborazione fatta del linguaggio naturale corrisponde a verità devo fare una ipotesi a priori sul rapporto di questi due individui.
Basandomi sul lavoro fatto da altri, un parametro -fra i tanti- per determinare la forza di legame è il numero di messaggi che due persone si scambiano.
ESEMPIO:
A scrive a B 10 Messaggi
B scrive ad A 10 Messaggi
Totale messaggi scambiati = 20.
Potrebbe verificarsi anche un caso del genere
A scrive ad A 1000 messaggi
B NON scrive ad A
Totale dei messaggi scambiati = 1000.
Per questo motivo devo pesare sia la quantità dei messaggi (2 persone che si scambiano 2 messaggi, 1 a testa, hanno un rapporto differente rispetto ad altre 2 persone che si scambiano 50 messaggi a testa), sia la differenza fra il numero di messaggi che si scambiano vicendevolmente (un conto è una conversazione bilaterale, un altro è che una persona "stalkera" un 'altra).
Inizialmente ho pensato di usare la seguente formula:
in questo modo però se si a e b si scambiano un numero pari di messaggi, l'argomento del logaritmo viene zero e non so come valutare questo caso.
In parole povere sto cercando consigli per definire una formula per pesare sia la quantità totale che la differenza di messaggi scambiati.
Qualsiasi aiuto sarà utile.
Grazie a tutti per il tempo concesso!
Basandomi sul lavoro fatto da altri, un parametro -fra i tanti- per determinare la forza di legame è il numero di messaggi che due persone si scambiano.
ESEMPIO:
A scrive a B 10 Messaggi
B scrive ad A 10 Messaggi
Totale messaggi scambiati = 20.
Potrebbe verificarsi anche un caso del genere
A scrive ad A 1000 messaggi
B NON scrive ad A
Totale dei messaggi scambiati = 1000.
Per questo motivo devo pesare sia la quantità dei messaggi (2 persone che si scambiano 2 messaggi, 1 a testa, hanno un rapporto differente rispetto ad altre 2 persone che si scambiano 50 messaggi a testa), sia la differenza fra il numero di messaggi che si scambiano vicendevolmente (un conto è una conversazione bilaterale, un altro è che una persona "stalkera" un 'altra).
Inizialmente ho pensato di usare la seguente formula:
Intensità = Numero messaggi totali/(log|M(a->b) - M(b->a)|)
in questo modo però se si a e b si scambiano un numero pari di messaggi, l'argomento del logaritmo viene zero e non so come valutare questo caso.
In parole povere sto cercando consigli per definire una formula per pesare sia la quantità totale che la differenza di messaggi scambiati.
Qualsiasi aiuto sarà utile.
Grazie a tutti per il tempo concesso!
Risposte
"francescojordan":
Buonasera a tutti. Sto scrivendo la mia tesi di laurea e mi piacerebbe avere un consiglio da voi matematici,ingegneri fisici o non laureati. Sto applicando un algoritmo per il calcolo della forza di legame fra due individui basandomi sui messaggi twitter. Per determinare però se l'elaborazione fatta del linguaggio naturale corrisponde a verità devo fare una ipotesi a priori sul rapporto di questi due individui.
Basandomi sul lavoro fatto da altri, un parametro -fra i tanti- per determinare la forza di legame è il numero di messaggi che due persone si scambiano.
ESEMPIO:
A scrive a B 10 Messaggi
B scrive ad A 10 Messaggi
Totale messaggi scambiati = 20.
Potrebbe verificarsi anche un caso del genere
A scrive ad A 1000 messaggi
B NON scrive ad A
Totale dei messaggi scambiati = 1000.
Per questo motivo devo pesare sia la quantità dei messaggi (2 persone che si scambiano 2 messaggi, 1 a testa, hanno un rapporto differente rispetto ad altre 2 persone che si scambiano 50 messaggi a testa), sia la differenza fra il numero di messaggi che si scambiano vicendevolmente (un conto è una conversazione bilaterale, un altro è che una persona "stalkera" un 'altra).
Inizialmente ho pensato di usare la seguente formula:
Intensità = Numero messaggi totali/(log|M(a->b) - M(b->a)|)
in questo modo però se si a e b si scambiano un numero pari di messaggi, l'argomento del logaritmo viene zero e non so come valutare questo caso.
In parole povere sto cercando consigli per definire una formula per pesare sia la quantità totale che la differenza di messaggi scambiati.
Qualsiasi aiuto sarà utile.
Grazie a tutti per il tempo concesso!
Io suggerirei di partire dalla costruzione di un grafo, in cui gli utenti sono i nodi e il numero di messaggi scambiati i pesi degli archi. Da una rappresentazione grafica che include utenti famosi, personaggi reali, personaggi fittizi e utenti non famosi (utenti normali), puoi cercare di dare una rappresentazione più precisa del tipo di utente e, quindi, delinerare delle formule.
Potrebbe esserti utile guardarti anche qualcosa relativo all'impatto delle network externalities. Potresti trarre qualche spunto (anche se lì l'ambito è economico, ovvero quanto fa "guadagnare" in termini di utilità l'ingresso di un nuovo utente nella rete).
Ti linko un articolo: http://www.google.it/url?sa=t&rct=j&q=& ... 9352,d.d24
Non ne so niente neppure io di reti sociali, però avevo pensato una cosa molto semplice.
Sia $a_b$ il numero di messaggio di A verso B e $b_a$ quelli di B verso A, l'intensità potrebbe essere
$I=((a_b+1)*(b_a+1))/(a_b+b_a)$ questa formula assume valori molto vicini a 1 se una sola delle persone invia messaggi all'altra.
Sia $a_b$ il numero di messaggio di A verso B e $b_a$ quelli di B verso A, l'intensità potrebbe essere
$I=((a_b+1)*(b_a+1))/(a_b+b_a)$ questa formula assume valori molto vicini a 1 se una sola delle persone invia messaggi all'altra.
Di reti sociali non so assolutamente niente, né niente del modello che usi (perché il logaritmo? Non rispondermi: è per dirti che non ne sono niente), ma un'idea empirica la avrei. Assumendo che il modello da te proposto non abbia chissà quali ipotesi da dover per forza tenere conto (sarà vero? Boh, io provo), potresti usare un qualcosa di empirico del tipo
\[I=\frac{N_{messaggi}}{\log{(|M_{a\to b}-M_{b\to a}|+1)}+1}\]
oppure
\[I=\frac{N_{messaggi}}{\log{(|M_{a\to b}-M_{b\to a}|+e})}\]
in questo modo, se i due si scambiano un numero pari di messaggi il denominatore diventa $1$, e la tua intensità $I$ diventerebbe semplicemente il numero totale di messaggi. Il modulo l'ho messo per rendere indifferente chi tra i due manda più messaggi. La seconda mi sembra convincente perché l'argomento del logaritmo non sarà mai né $0$ né $1$, rendendo quella frazione sempre determinata.
Spero di averti dato almeno un quarto di idea decente. Ciao!
PS. Sarebbe utile agli esperti del forum sapere il CdL per cui prepari questa tesi.
\[I=\frac{N_{messaggi}}{\log{(|M_{a\to b}-M_{b\to a}|+1)}+1}\]
oppure
\[I=\frac{N_{messaggi}}{\log{(|M_{a\to b}-M_{b\to a}|+e})}\]
in questo modo, se i due si scambiano un numero pari di messaggi il denominatore diventa $1$, e la tua intensità $I$ diventerebbe semplicemente il numero totale di messaggi. Il modulo l'ho messo per rendere indifferente chi tra i due manda più messaggi. La seconda mi sembra convincente perché l'argomento del logaritmo non sarà mai né $0$ né $1$, rendendo quella frazione sempre determinata.
Spero di averti dato almeno un quarto di idea decente. Ciao!
PS. Sarebbe utile agli esperti del forum sapere il CdL per cui prepari questa tesi.