Legalità webscraping

Sk_Anonymous
Salve,

Sapete qualcosa sulla legalità del webscraping?

Parliamo del download automatico di pagine web da un sito e il processare e collezionare in maniera automatica i dati così raccolti.

So che nessuno di noi qui è avvocato. Però magari qualcuno ha qualche esperienza in merito.

Io non mi esprimo. Non voglio condizionarvi :lol:

Risposte
Intermat
"Overflow94":
Finché non fai un'applicazione commerciale con i dati raccolti o ledi direttamente il sito non rischi niente. I termini e condizioni di utilizzo non sono legge, dovrebbero portarti davanti a un giudice per imputarti qualcosa e dubito che in assenza di uno dei due eventi citati prima 1) il sito abbia interesse a farti causa 2) un giudice possa condannarti.

Esatto, era un po' quello che dicevo anche io. Ovvero che se non li usi per fini commerciali alla fine nessuno verrà a chiederti niente. Detto questo, come è già stato fatto notare, lui chiedeva se era legale e, dato che il sito lo vieta, non lo è. Concordo che, ragionevolmente, nessuno andrà mai da lui a chiedergli conto dello scraping, a meno che i dati non siano stati rivenduti o utilizzati per fini commerciali.

Overflow94
Finché non fai un'applicazione commerciale con i dati raccolti o ledi direttamente il sito non rischi niente. I termini e condizioni di utilizzo non sono legge, dovrebbero portarti davanti a un giudice per imputarti qualcosa e dubito che in assenza di uno dei due eventi citati prima 1) il sito abbia interesse a farti causa 2) un giudice possa condannarti.

axpgn
@raffamaiden

Il bambino non ha nessun diritto, è tollerato, è lecito (se del caso) ... son cose molto diverse dal punto di vista legale ... e non c'è bisogno di chiamare la scientifica basta stare attenti a quello che fa e se sta entrando in un fondo dove questo è vietato, un "normale" genitore dovrebbe impedirlo, che ci siano mine o fiori fa lo stesso ...

In tutta quella sentenza si ribadisce più volte che non è necessaria la chiusura o la recinzione del fondo ma occorre (ed è sufficiente) la chiara e manifesta volontà del proprietario di vietare l'ingresso; se quella c'è, l'ingresso è abusivo e la colpa non è del proprietario (diversamente dal caso della sentenza dove non c'era traccia né di divieti né di protezioni).

Peraltro la fattispecie del tuo caso è del tutto diversa: tu non sei entrato in un sito e poi sei stato danneggiato nel sito, ma al contrario, sei entrato nel sito e nonostante il divieto (che conosci) compi delle operazioni che ti sono state precluse (e di cui sei conscio) ... che poi dal punto di vista pratico, non succeda niente, è molto probabile ma tu nel titolo del post chiedevi della legalità di questo comportamento e mi pare evidente che non lo sia ...

Cordialmente, Alex

cooper1
"raffamaiden":
vorrei sapere quando si forma il contratto

da dei rimasugli di diritto so che un contratto per non essere nullo deve possedere degli elementi essenziali, in particolare

    1. Accordo delle parti (consenso);
    2. Causa(l’obiettivo);
    3. Oggetto (contenuto);
    4. Forma (modo in cui si manifesta la volontà), qui in Italia è libera
    [/list:u:334w7k0l]
    detto questo mi sembra quindi che il contratto si formi nel momento in cui incominci ad utilizzare i servizi del sito, infatti hai a monte la causa, l'oggetto, la forma (i termini di utilizzo). nel momento in cui inizi ad utilizzare i servizi del sito dai implicitamente il tuo consenso formando di fatto il contratto (un po' come quando sei al supermercato :-D )

Intermat
Secondo me il problema è "cosa ci fai con questi dati"?
Perché, parliamoci chiaramente, come ti hanno già detto, al 99% (per tirare una probabilità a casaccio), l'unica cosa che ti può succedere è che ti blocchino. Diverso è il caso in cui tu usassi i tuoi dati per fini commerciali. Lì se qualcuno se ne accorgesse, forse ti potrebbe dire qualcosa. Ma se ci devi fare qualcosa che non devi rivendere o che non deve riportare la fonte di quei dati (tipo in un articolo scientifico non ce lo vedo benissimo) penso lo possa fare tranquillamente.
Fermo restando che usando il sito tu accetti le condizioni di utilizzo. Vuoi o non vuoi è una specie di contratto verbale che tu accetti continuando ad utilizzare il sito (con i cookies c'è proprio scritto).

Sk_Anonymous
Ti rispondo l'ultima volta solo su una frase perchè siamo off-topic

"axpgn":
e quel bambino non ha nessun diritto di stare in quel campo


Io non credo

"Corte Suprema":
in difetto il proprietario dimostra [...] di volere precariamente tollerare il passaggio medesimo


Ma anche dall'incipit

il passaggio sul fondo altrui costituisce un illecito quando[...]


Se non sono rispettate le condizioni che seguono, il passaggio non è illecito, quindi è lecito

Ancora

”Il fondamento della responsabilità ex art. 2051 CC per il danno cagionato dalle cose che si hanno in custodia è costituito dalla violazione dell'obbligo di sorveglianza, il quale presuppone però che il terzo danneggiato abbia un titolo per entrare in legittima relazione con la cosa ..[..] ... Pertanto, nel caso in cui taluno abusivamente acceda all'altrui proprietà, esula la responsabilità per danni cagionati dalle cose in custodia ex art. 2051 c.c. mentre sussisterebbe la generale responsabilità aquiliana ex art. 2043 c.c., ove sia configurabile l'esistenza sul fondo di un pericolo imprevedibile dal quale il proprietario dello stesso,che non lo abbia chiuso, non abbia adempiuto l'obbligo di preservare l'incolumità dei passanti


P.S. i genitori hanno il dovere di sorvegliare i minori, non di chiamare la scientifica per assicurarsi che sul tuo fondo non recintato non ci siano mine anti-uomo.

********************************************************

Comunque probabilmente ho sbagliato io a fare l'esempio. Quello più pertinente era forse il cartello con i 100 €/h da pagare, che ci riporta alla domanda "quando siamo tenuti a rispettare le condizioni d'uso di un sito"

axpgn
Non mi pare proprio ... in quella sentenza si ripete più volte che non è necessaria la chiusura del fondo ma è sufficiente "... una manifestazione di volontà [del divieto di accesso - nota mia], espressa in maniera certa ..." e questo lo si legge diverse volte; nel caso che citi è ribadito il disinteresse del proprietario e la mancanza assoluta di divieti o segnali di pericolo, inoltre la protezione del "buco" c'era ed era stata tolta, non segnalandola, che è esattamente il contrario di quanto stiamo dibattendo: accesso libero ma divieto di fare determinate cose.

I genitori hanno sempre l'obbligo di sorvegliare i minori non emancipati e quel bambino non ha nessun diritto di stare in quel campo, eventualmente, al massimo, non ha nessuna colpa (o meglio i genitori), che è una cosa completamente diversa.

Sk_Anonymous
"axpgn":

Idem come prima, la responsabilità in questo caso è dei genitori, è pacifico ... poi si può ipotizzare anche una responsabilità del proprietario nel caso non abbia rispettato eventuali regole ma comunque sarebbe al massimo in concorso con i genitori ...
Ammiro la perseveranza ... :-D
Cordialmente, Alex


Purtroppo la Corte Suprema non concorda con te

"Corte Suprema":
il passaggio sul fondo altrui costituisce un illecito quando contraddice ad un divieto che derivi o dalla chiusura del fondo o da una manifestazione di volontà del proprietario, espressa in maniera certa, sulla cui cognizione da parte dei terzi non possa ricorrere dubbio: in difetto il proprietario dimostra di considerare il passaggio di estranei sul suo fondo come non dannoso al godimento di questo e di volere precariamente tollerare il passaggio medesimo, il che però gli impone l'obbligo di mantenere l'immobile in condizioni di preservare l'incolumità del passante da pericoli imprevedibili in esso esistenti


Unito all'art. 40 codice penale

"art. 40":
Non impedire un evento, che si ha l'obbligo giuridico di impedire, equivale a cagionarlo


Ne consegue che il proprietario risponde di omicidio.

I genitori CREDO che non rispondano proprio di nulla, avendo il bambino pieno diritto di stare sul fondo altrui, non essendo questo recintato e l'unico cartello disponibile consente l'ingresso (quindi non è presente nessuna delle due possibilità che la Corte consente). E in ogni caso, anche se il cartello non consentisse l'ingresso, è tutto da dimostrare che un singolo cartello posto in alto e scritto in piccolo permetta una "cognizione da parte dei terzi [sulla quale] non possa ricorrere dubbio"

axpgn
"raffamaiden":
Proprietario: "Non c'è perchè glielo hai tolto tu quando sei entrato. Ho un sacco di testimoni che dicono che prima il cartello c'era, nonchè una foto che mostra il quotidiano di stamattina e il cartello sullo sfondo"

Mò che facciamo?

So sempre cavoli tuoi ... :lol: ... puoi arrampicarti sugli specchi quanto vuoi, ma non ti vedo bene nel dimostrare la tua buona fede se non hai testimoni (ed anche se li avessi, il contadino non avrebbe torto ... )

"raffamaiden":
Su un campo senza alcuna recinzione c'è il seguente cartello "Proprietà privata. Regole: non andare oltre 100 metri". Questo perchè dopo 100 metri sono presenti mine anti-uomo (è una proprietà privata)

Un bambino che sa leggere a mala pena sta giocando per strada. Corre, entra nel campo, supera i 100 metri e salta per aria

Mò che facciamo?


Idem come prima, la responsabilità in questo caso è dei genitori, è pacifico ... poi si può ipotizzare anche una responsabilità del proprietario nel caso non abbia rispettato eventuali regole ma comunque sarebbe al massimo in concorso con i genitori ...

Ammiro la perseveranza ... :-D

Cordialmente, Alex

Sk_Anonymous
"Rigel":
Da quello che dici, penso sia un diritto dei gestori bloccarti se ritengono che tu abbia violato le condizioni d'uso.
D'altra parte, se il tuo script, ad esempio, manda richieste http a intervalli di tempo random (diciamo di 2-5 secondi), dubito che ci sia la possibilità di dimostrare che tu abbia fatto webscraping.
Tutto questo per dire che ti possono bloccare, ma mi sembra molto improbabile che ti possano perseguire...


E' quello che io personalmente penso

Reati non ce ne sono, altrimenti i gestori di Google, Yahoo e gli altri motori di ricerca sarebbero in carcere già da tempo

Al massimo c'è una violazione contrattuale, ma se io non ho espresso alcuna volontà di accettare le loro condizioni come fa ad esserci un contratto? Su internet quando si forma un contratto?

E' previsto che mi blocchino, penali da pagare non ce ne sono. Tenendo a parte il discorso che sarebbe estremamente difficile farmele pagare, anche se mi connettessi da casa mia, e ancora di più se per es. mi connettessi dalla biblioteca. Ma questo è un discorso a parte, che non riguarda il "se" ma il "come".

Poi il punto forte sarebbe che se cerchi il loro sito su Google trovi queste informazioni. Quindi a Google consentono di fare webscraping, mentre agli altri motori di ricerca no. Ma questo è ancora un altro discorso che riguarda la concorrenza (se ci fosse questo contratto, quella clausola sarebbe nulla perchè finalizzata a limitare la concorrenza)

E' che non so su internet quando e dove si forma un contratto. Che si possano fare contratti è chiaro, altrimenti non potresti comprare da Amazon e avere la garanzia e il diritto di recesso. Però vorrei sapere quando si forma il contratto

Rigel1
Da quello che dici, penso sia un diritto dei gestori bloccarti se ritengono che tu abbia violato le condizioni d'uso.
D'altra parte, se il tuo script, ad esempio, manda richieste http a intervalli di tempo random (diciamo di 2-5 secondi), dubito che ci sia la possibilità di dimostrare che tu abbia fatto webscraping.
Tutto questo per dire che ti possono bloccare, ma mi sembra molto improbabile che ti possano perseguire...

Sk_Anonymous
"axpgn":
A parte il fatto che "la legge non ammette ignoranza", sei tu che devi dimostrare d non aver visto il cartello (mica è casa tua, sei tu che devi stare attento alle regole che vigono in casa altrui ...) ... inoltre, tu il cartello lo hai visto (per tua stessa ammissione) quindi lo sai che NON puoi ... poi, ovviamente, fai quello che vuoi ... :-D


Su un campo senza alcuna recinzione c'è il seguente cartello "Proprietà privata. Regole: non andare oltre 100 metri". Questo perchè dopo 100 metri sono presenti mine anti-uomo (è una proprietà privata)

Un bambino che sa leggere a mala pena sta giocando per strada. Corre, entra nel campo, supera i 100 metri e salta per aria

Mò che facciamo?

Sk_Anonymous
"axpgn":

Paghi, che ci vuoi fare ? :lol: ... tua è la mancanza, tuo lo sbaglio, quindi son cavoli tuoi ... :-D (più seriamente, la realtà è un po' più variegata di così, però in questo caso non mi sembra ci possano essere dubbi ... :wink: )


Tu entri in un campo e ci stai un'ora
Arriva il proprietario "Salve, sono 100€"
Tu : "Cosa?"
Propetario: "Il cartello dice che per ogni ora si paga 100€"
Tu: "Ma non c'è nessun cartello"
Proprietario: "Non c'è perchè glielo hai tolto tu quando sei entrato. Ho un sacco di testimoni che dicono che prima il cartello c'era, nonchè una foto che mostra il quotidiano di stamattina e il cartello sullo sfondo"

Mò che facciamo?

axpgn
A parte il fatto che "la legge non ammette ignoranza", sei tu che devi dimostrare d non aver visto il cartello (mica è casa tua, sei tu che devi stare attento alle regole che vigono in casa altrui ...) ... inoltre, tu il cartello lo hai visto (per tua stessa ammissione) quindi lo sai che NON puoi ... poi, ovviamente, fai quello che vuoi ... :-D

"raffamaiden":
Se invece c'è scritto "potete entrare liberamente purchè paghiate 100 €/h" e tu non vedi il cartello e ci entri che facciamo?

Paghi, che ci vuoi fare ? :lol: ... tua è la mancanza, tuo lo sbaglio, quindi son cavoli tuoi ... :-D (più seriamente, la realtà è un po' più variegata di così, però in questo caso non mi sembra ci possano essere dubbi ... :wink: )

Sk_Anonymous
"axpgn":
Quindi se in un campo c'è un cartello con scritto "Potete entrare liberamente ma non raccogliete i fiori" tu li raccogli lo stesso perché non hai "firmato" niente? :?


Esatto

Se invece c'è scritto "potete entrare liberamente purchè paghiate 100 €/h" e tu non vedi il cartello e ci entri che facciamo?

axpgn
Quindi se in un campo c'è un cartello con scritto "Potete entrare liberamente ma non raccogliete i fiori" tu li raccogli lo stesso perché non hai "firmato" niente? :?

Sk_Anonymous
Stavo pensando di fare il webscraping di un sito che nei suoi termini di utilizzo dice che è vietato fare webscraping

Giacchè il sito non richiede alcuna registrazione per accedere a questi dati, mi chiedevo se si può ritenere che io abbia "firmato" questi termini

Intermat
"raffamaiden":
Capisco. Aggiungiamo 2 elementi

Immagina che a tali dati si acceda dopo una registrazione gratuita al sito, e nella registrazione accetti le condizioni d'uso che dicono che non devi fare webscraping. In questo caso continuano a non esserci problemi?

Mi sembra evidente che se nelle condizioni d'uso c'è scritto che non puoi fare scraping allora non lo puoi fare. Alla fine, nessuno ci pensa, ma si sta firmando un contratto e dunque va rispettato.

"raffamaiden":

Altro elemento: immagina che a un certo punto il sito ti becca e ti blocca, chiedendoti di risolvere un captcha per accedere ai dati. Puoi risolvere manualmente il captcha e riavviare il webscraper? O il blocco va inteso come diffida da parte del proprietario del sito a cessare questa attività? Puoi avere un webscraper ancora più sofisticato che riconosce che il sito ha mandato un captcha, prende l'immagine del captcha, te la manda per email, tu rispondi all'email con la soluzione (anche se sei in metro), lui riceve l'email e inserisce la soluzione. Oppure, se riuscisse a risolvere il captcha senza intervento umano?


Direi che qui veramente dovresti sentire il parere di un avvocato. Non ho la più pallida idea di come dovrebbe essere considerato il captcha.

"raffamaiden":

Altro elemento: ipotizziamo che i dati siano a pagamento. Tu paghi e hai accesso ai dati. Puoi benissimo prendere un foglio di carta e copiarli a mano. Puoi benissimo copiarli in un file Excel. E il proprietario del sito non può impedirti di farlo, non può venire a casa tua e dirti che non devi trascrivere i dati a mano. Ora, al proprietario cosa gli cambia se il file Excel anzichè farlo a mano lo fa un software?

Infatti se non è vietato lo scraping (vedi punto 1) e il sito richiede una registrazione (eventualmente a pagamento) per poter scaricare i dati allora non c'è niente di male a fare scraping. Diverso è il caso in cui nelle condizioni di utilizzo c'è scritto che la registrazione (anche a pagamento) permette di consultare i dati ma non di scaricarli (ritorni al punto 1).

Come mai questa curiosità?

Sk_Anonymous
Capisco. Aggiungiamo 2 elementi

Immagina che a tali dati si acceda dopo una registrazione gratuita al sito, e nella registrazione accetti le condizioni d'uso che dicono che non devi fare webscraping. In questo caso continuano a non esserci problemi?

Altro elemento: immagina che a un certo punto il sito ti becca e ti blocca, chiedendoti di risolvere un captcha per accedere ai dati. Puoi risolvere manualmente il captcha e riavviare il webscraper? O il blocco va inteso come diffida da parte del proprietario del sito a cessare questa attività? Puoi avere un webscraper ancora più sofisticato che riconosce che il sito ha mandato un captcha, prende l'immagine del captcha, te la manda per email, tu rispondi all'email con la soluzione (anche se sei in metro), lui riceve l'email e inserisce la soluzione. Oppure, se riuscisse a risolvere il captcha senza intervento umano?

Cosa succede se entrambi gli elementi sono combinati?

Altro elemento: ipotizziamo che i dati siano a pagamento. Tu paghi e hai accesso ai dati. Puoi benissimo prendere un foglio di carta e copiarli a mano. Puoi benissimo copiarli in un file Excel. E il proprietario del sito non può impedirti di farlo, non può venire a casa tua e dirti che non devi trascrivere i dati a mano. Ora, al proprietario cosa gli cambia se il file Excel anzichè farlo a mano lo fa un software?

Intermat
Se i dati sono disponibili gratuitamente e il download non è a pagamento non vedo perché dovrebbe essere un problema. Esistono dei package di linguaggi come R fatti proprio per fare scraping. Non ci vedo nulla di illegale (di base, ovviamente).

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.