Due problemi di statistica
Salve, ho delle difficoltà con i seguenti due problemi, che si trovano nel capitolo di statistica nel libro i matematica da cui sono tratti:
1) Una conduttura idrica, a causa di quattro rotture, subisce via via le seguenti perdite percentuali sui successivi flussi: 4%, 9%, 10%, 2%. Calcola la percentuale media di perdita.
La soluzione che ho seguito io è stata trovare la media geometrica dei fattori (1+tasso), tuttavia ottengo 6,197% mentre il libro propone 6.31%.
2) Si vuole aprire una videoteca lungo una strada nella quale ci sono quattro palazzi: A, B, C, D. Le distanze relative tra i palazzi sono d(A;B)=300m; d(B;C)=100m; d(C;D)=150m. Il numero di inquilini per ogni palazzo è n_a=84; n_b=110; n_c=66; n_d=124.
Richiesta 1: Determina la posizione ottimale per la videoteca.
Richiesta II: Lungo la strada c'è un forno tra C e D, a 50 metri da D. Gli inquilini del palazzo A impiegano, per arrivare al forno: 300 s a piedi, 120s in bici, 100 s in auto. Determina la velocità media per ciascun inquilino.
Soluzioni proposte sono I 300 metri da A verso D
II 2.89 m/s.
Spero qualcuno possa darmi una risoluzione o almeno delle linee guida per come risolverlo.
1) Una conduttura idrica, a causa di quattro rotture, subisce via via le seguenti perdite percentuali sui successivi flussi: 4%, 9%, 10%, 2%. Calcola la percentuale media di perdita.
La soluzione che ho seguito io è stata trovare la media geometrica dei fattori (1+tasso), tuttavia ottengo 6,197% mentre il libro propone 6.31%.
2) Si vuole aprire una videoteca lungo una strada nella quale ci sono quattro palazzi: A, B, C, D. Le distanze relative tra i palazzi sono d(A;B)=300m; d(B;C)=100m; d(C;D)=150m. Il numero di inquilini per ogni palazzo è n_a=84; n_b=110; n_c=66; n_d=124.
Richiesta 1: Determina la posizione ottimale per la videoteca.
Richiesta II: Lungo la strada c'è un forno tra C e D, a 50 metri da D. Gli inquilini del palazzo A impiegano, per arrivare al forno: 300 s a piedi, 120s in bici, 100 s in auto. Determina la velocità media per ciascun inquilino.
Soluzioni proposte sono I 300 metri da A verso D
II 2.89 m/s.
Spero qualcuno possa darmi una risoluzione o almeno delle linee guida per come risolverlo.
Risposte
1 ) dato che sono delle perdite devi fare la media geometrica dei flussi netti, ovvero 1 meno il tasso e non $+$ come hai fatto tu :
$m=1-root (4)(0.96\cdot0.91\cdot0.90\cdot0.98)~~6.31%$
2a) per una nota proprietà dello scostamento medio semplice, la distanza ottimale è quella mediana.
2b) la media delle velocità è per sua natura una media armonica
Con questi aiuti dovresti risolvere; le soluzioni non te le posso mettere prima di vedere le tue bozze risolutive perché ti devi sforzare a trovare la soluzione da solo.
Ricordati che per calcolare la mediana devi utilizzare come "pesi" il numero relativo degli inquilini.
Ciao
$m=1-root (4)(0.96\cdot0.91\cdot0.90\cdot0.98)~~6.31%$
2a) per una nota proprietà dello scostamento medio semplice, la distanza ottimale è quella mediana.
2b) la media delle velocità è per sua natura una media armonica
Con questi aiuti dovresti risolvere; le soluzioni non te le posso mettere prima di vedere le tue bozze risolutive perché ti devi sforzare a trovare la soluzione da solo.
Ricordati che per calcolare la mediana devi utilizzare come "pesi" il numero relativo degli inquilini.
Ciao
Per quanto riguarda il primo esercizio ho capito di aver compiuto un errore concettuale, che ho corretto.
Il secondo però ancora ho delle difficoltà, per il primo punto.
Il secondo punto del secondo esercizio mi risulta:
$ v_m=3/((100/500)+(120/500)+(300/500))⋍2,89m/s $
Però il primo punto non saprei come risolverlo. Senza tenere conto del numero di inquilini ho provato a trovare la posizione della videoteca cercando il punto in cui la somma dei quadrati delle distanze da A è minima, cioè il minimo della funzione:
$ f(x)=(x-300)^2+x^2+(x-400)^2+(x-550)^2 $
che si ha per x=312,5 m, che discosta di 12,5 m dalla soluzione del libro, ed è quindi sbagliato.
Però sul come tenere conto del numero di inquilini, non saprei. Mi potrebbe spiegare meglio la soluzione da lei proposta, in quanto non la capisco?
Grazie ancora per la risposta.
Il secondo però ancora ho delle difficoltà, per il primo punto.
Il secondo punto del secondo esercizio mi risulta:
$ v_m=3/((100/500)+(120/500)+(300/500))⋍2,89m/s $
Però il primo punto non saprei come risolverlo. Senza tenere conto del numero di inquilini ho provato a trovare la posizione della videoteca cercando il punto in cui la somma dei quadrati delle distanze da A è minima, cioè il minimo della funzione:
$ f(x)=(x-300)^2+x^2+(x-400)^2+(x-550)^2 $
che si ha per x=312,5 m, che discosta di 12,5 m dalla soluzione del libro, ed è quindi sbagliato.
Però sul come tenere conto del numero di inquilini, non saprei. Mi potrebbe spiegare meglio la soluzione da lei proposta, in quanto non la capisco?
Grazie ancora per la risposta.
La funzione di distanza da minimizzare è la seguente:
dove $f_i $ sono le frequenze relative (cioè le % di inquilini) e le $X_i$ sono le distanze dall'origine. Puoi minimizzarla in modo analitico (tanto sono tutti segmenti di retta) oppure (ed è il metodo statistico) sfruttando una proprietà nota che garantisce che quella funzione è minima quando $d= m e d i a n a $.
Per calcolare la mediana basta fare
$m e = F^(-1)(1/2) $ dove $F $ è la funzione di ripartizione, ovvero la funzione cumulativa delle frequenze.
Ora, dato che entro 300 m si cumulano più del 50% degli inquilini è immediato desumere che 300 è il valore mediano, cioè quello ottimale, come si vede bene dal grafico seguente:

Il resto va bene
$D(d)=sum_ i |X_i-d|f_i $
dove $f_i $ sono le frequenze relative (cioè le % di inquilini) e le $X_i$ sono le distanze dall'origine. Puoi minimizzarla in modo analitico (tanto sono tutti segmenti di retta) oppure (ed è il metodo statistico) sfruttando una proprietà nota che garantisce che quella funzione è minima quando $d= m e d i a n a $.
Per calcolare la mediana basta fare
$m e = F^(-1)(1/2) $ dove $F $ è la funzione di ripartizione, ovvero la funzione cumulativa delle frequenze.
Ora, dato che entro 300 m si cumulano più del 50% degli inquilini è immediato desumere che 300 è il valore mediano, cioè quello ottimale, come si vede bene dal grafico seguente:
Click sull'immagine per visualizzare l'originale

Il resto va bene

Grazie mille.
Potrebbe però confermarmi un ultimo dubbio più operativo:
cioè, quella che così trovo è una sorta di "mediana pesata", in buona sostanza trovo la percentuale di inquilini riferita al palazzo (per ogni palazzo). Imposto tali percentuali nello stesso ordine in cui si trovano le distanze da A dei palazzi quando poste in ordine crescente, e poi calcolo le frequenze relative cumulate percentuali. Non appena raggiungo o supero il 50%, sarà in corrispondenza di tale valore che si dovrà trovare la videoteca.
Avrei quindi:
(0;21,88%); (300;28,65%); (400;17,19%); (550;39,29%)
E come frequenze relative percentuali cumulate:
(0;21,88%); (300;50,53%); (400;67,72%); (550;107%)
Avendo il 50,53% in corrispondenza di una distanza di 300 metri da A, allora sarà proprio in A che dovrà essere posta la videoteca?
Potrebbe però confermarmi un ultimo dubbio più operativo:
cioè, quella che così trovo è una sorta di "mediana pesata", in buona sostanza trovo la percentuale di inquilini riferita al palazzo (per ogni palazzo). Imposto tali percentuali nello stesso ordine in cui si trovano le distanze da A dei palazzi quando poste in ordine crescente, e poi calcolo le frequenze relative cumulate percentuali. Non appena raggiungo o supero il 50%, sarà in corrispondenza di tale valore che si dovrà trovare la videoteca.
Avrei quindi:
(0;21,88%); (300;28,65%); (400;17,19%); (550;39,29%)
E come frequenze relative percentuali cumulate:
(0;21,88%); (300;50,53%); (400;67,72%); (550;107%)
Avendo il 50,53% in corrispondenza di una distanza di 300 metri da A, allora sarà proprio in A che dovrà essere posta la videoteca?
"SirDanielFortesque":
allora sarà proprio in A che dovrà essere posta la videoteca?
in B. Quella che trovi è ESATTAMENTE la mediana...ed è il punto ottimale in quanto minimizza la funzione di distanza che ti ho indicato[nota]e che in Statistica rappresenta un indice di variabilità ben definito: è lo Scostamento medio Semplice[/nota]. La dimostrazione si trova sui principali testi di statistica e quindi non sto a ricopiarla qui...ma può essere un buon esercizio controllarlo. Basta disegnare il grafico della funzione di distanza e vedrai che il minimo è proprio in $d=300$
Io ho fatto i conti con la calcolatrice arrotondando alla 4° cifra ottenendo la seguente funzione di distanza
$D-={{: ( 332.2917-0.5625d , ;0<=d<300 ),( 160.4147+0.0104d , ;300<=d<400 ),( 22.9167+0.3542d , ;400<=d<=550) :}$
per fare le cose fatte bene dovresti tenere le frazioni ....ma già così vedi che il minimo è proprio in $d=300$ ovvero in corrispondenza del palazzo B.
Il metodo di utilizzare la mediana è ovviamente più immediato (e più corretto da un punto di vista statistico)
ciao
Si, B; errore di battitura. Grazie ancora.
attento che anche nel calcolo delle frequenze hai fatto un errore...l'ultima è 32.29% e il totale cumulato ovviamente deve essere 100%
Inoltre potrebbe accadere che il 50% dei valori cumulati sia proprio in corrispondenza di due distinti punti....in quel caso tutti i valori compresi fra i due punti sono valori mediani...e alcuni testi ne prendono la media (altri no, li considerano tutti punti mediani; in questo caso fai riferimento a cosa ti dice il tuo insegnante)
Inoltre potrebbe accadere che il 50% dei valori cumulati sia proprio in corrispondenza di due distinti punti....in quel caso tutti i valori compresi fra i due punti sono valori mediani...e alcuni testi ne prendono la media (altri no, li considerano tutti punti mediani; in questo caso fai riferimento a cosa ti dice il tuo insegnante)