Kom ihåg mig?
Home Menu

Menu


Företaget Netix stäms pga scraping

 
Ämnesverktyg Visningsalternativ
Oläst 2010-03-18, 11:55 #11
Draqir Draqir är inte uppkopplad
Medlem
 
Reg.datum: May 2009
Inlägg: 125
Draqir Draqir är inte uppkopplad
Medlem
 
Reg.datum: May 2009
Inlägg: 125
Citat:
Ursprungligen postat av Bjorne Visa inlägg
Vill man inte få sina sidor scrapade finns det system för att enkelt undvika det.
Nej, du kan inte enkelt undvika alla möjliga scraping attacker genom enkla system av anti-proxy eller ännu enklare ip-banns vid ett visst antal requests och så vidare. Visst du kan lägga in Asirra eller någon mycket jobbigare kontroll än reCaptcha, eller något som kan brytas av anti-captcha algoritmer för att visa varje sida, varje gång den anropas, sådant skulle försena scraping en hel del och givetvis göra sidan den mest jobbiga i världen. Men du kan aldrig, om du har en publik sida undvika att informationen stjäls.
Draqir är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-03-18, 12:05 #12
Aron L Aron L är inte uppkopplad
Nykomling
 
Reg.datum: Jul 2008
Inlägg: 47
Aron L Aron L är inte uppkopplad
Nykomling
 
Reg.datum: Jul 2008
Inlägg: 47
Debatten om scraping är jäkligt intressant. Är ju lite tjatigt att ta som exempel kanske men ändå: Google är ju världens största scraper. De livnär sig till 100% på att presentera världens alla webbplatser och dess innehåll i kommersiellt syfte.

Är det någon skillnad på att låta en dator samla in samma information som går att samla in manuellt? Går i sådant fall gränsen i automatiseringen? Tel. nr och den typen av uppgifter är ju faktiskt ingen som kan sätta (c) på.
Aron L är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-03-18, 12:35 #13
Draqir Draqir är inte uppkopplad
Medlem
 
Reg.datum: May 2009
Inlägg: 125
Draqir Draqir är inte uppkopplad
Medlem
 
Reg.datum: May 2009
Inlägg: 125
Citat:
Ursprungligen postat av Aron L Visa inlägg
[..]De livnär sig till 100% på att presentera världens alla webbplatser och dess innehåll i kommersiellt syfte.[..]

Är det någon skillnad på att låta en dator samla in samma information som går att samla in manuellt? Går i sådant fall gränsen i automatiseringen? Tel. nr och den typen av uppgifter är ju faktiskt ingen som kan sätta (c) på.
Google livnär sig inte enbart på deras sökmotor, samt att de inte heller söker igenom alla webbplatser, då de är snälla och lyder robots.txt

Jämför att använda tiotusentals ip adresser där en ip adress, en tid väljs med en pseudoslumptalsgenerator som inte söker igenom en sida på ett sekventiellt sätt med en människa som sitter på en fast ip adress och går igenom sida för sida sekventiellt. En är väldigt ineffektiv och väldigt enkel att blocka. En är så gott som omöjlig att blocka och läskigt effektiv.
Draqir är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-03-18, 17:22 #14
Magnus_A Magnus_A är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: May 2006
Inlägg: 2 604
Magnus_A Magnus_A är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: May 2006
Inlägg: 2 604
Katalogskyddet borde vara ganska lätt att hävda i en rättsprocess för ägaren. Skraparen ligger rätt illa till.
Magnus_A är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-03-18, 17:32 #15
tartareandesire tartareandesire är inte uppkopplad
Supermoderator
 
Reg.datum: Jan 2004
Inlägg: 11 585
tartareandesire tartareandesire är inte uppkopplad
Supermoderator
 
Reg.datum: Jan 2004
Inlägg: 11 585
Citat:
Ursprungligen postat av Magnus_A Visa inlägg
Katalogskyddet borde vara ganska lätt att hävda i en rättsprocess för ägaren. Skraparen ligger rätt illa till.
Jag skulle gärna vilja se exempel på några relativt aktuella rättsprocesser där katalogskydd har tagits upp. Jag tycker helt klart att man inte har rätt att kopiera någon annans arbete men samtidigt så är lagdefinitionen av katalogskydd i min mening ganska värdelös:

Citat:
Den som har framställt en katalog, en tabell eller ett annat dylikt arbete i vilket ett stort antal uppgifter har sammanställts eller vilket är resultatet av en väsentlig investering har uteslutande rätt att framställa exemplar av arbetet och göra det tillgängligt för allmänheten.
Uteslutande rätt att framställa vad exakt? Innehållet kan omöjligen vara skyddat?

Om någon kopierar mitt arbete lika uppenbart som i detta fallet så är det ju en sak men om det hela görs manuellt? Vad gäller då? Jag kan omöjligt bevisa någonting alls förutom att de har samma data.
__________________
Full-stack developer, free for smaller assignments

Senast redigerad av tartareandesire den 2010-03-18 klockan 17:34
tartareandesire är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-03-18, 19:39 #16
Bjorne Bjorne är inte uppkopplad
Flitig postare
 
Reg.datum: Sep 2009
Inlägg: 374
Bjorne Bjorne är inte uppkopplad
Flitig postare
 
Reg.datum: Sep 2009
Inlägg: 374
Citat:
Ursprungligen postat av Draqir Visa inlägg
Nej, du kan inte enkelt undvika alla möjliga scraping attacker genom enkla system av anti-proxy eller ännu enklare ip-banns vid ett visst antal requests och så vidare. Visst du kan lägga in Asirra eller någon mycket jobbigare kontroll än reCaptcha, eller något som kan brytas av anti-captcha algoritmer för att visa varje sida, varje gång den anropas, sådant skulle försena scraping en hel del och givetvis göra sidan den mest jobbiga i världen. Men du kan aldrig, om du har en publik sida undvika att informationen stjäls.
För det första stjäls inte information. För det andra är inte web scraping en form av attack. För det tredje, jo du kan visst enkelt undvika att bli scrapad. Utan att använda captcha. Försök scrapa google får du se.
Bjorne är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-03-18, 19:44 #17
tartareandesire tartareandesire är inte uppkopplad
Supermoderator
 
Reg.datum: Jan 2004
Inlägg: 11 585
tartareandesire tartareandesire är inte uppkopplad
Supermoderator
 
Reg.datum: Jan 2004
Inlägg: 11 585
Citat:
Ursprungligen postat av Bjorne Visa inlägg
För det första stjäls inte information. För det andra är inte web scraping en form av attack. För det tredje, jo du kan visst enkelt undvika att bli scrapad. Utan att använda captcha. Försök scrapa google får du se.
Vad menar du med att information inte stjäls och vad menar du med att det inte är en attack? Det beror ju helt på hur du definierar orden... I mina ögon är det ren stöld och det är givetvis också en attack mot min verksamhet då trafiken är inget annat än skadlig för mig.
__________________
Full-stack developer, free for smaller assignments

Senast redigerad av tartareandesire den 2010-03-18 klockan 20:07
tartareandesire är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-03-18, 22:00 #18
Magnus_A Magnus_A är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: May 2006
Inlägg: 2 604
Magnus_A Magnus_A är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: May 2006
Inlägg: 2 604
Här är ett aktuellt svenskt fall om katalogskydd:
http://www.wn.se/showthread.php?t=29066

Lazyman här på WN skriver:
Citat:
Ärendet handlar om katalogskydd. Arbetet med att skapa databas och strukturera data är skyddat även om du inte äger de enskilda siffrorna, tex telefonnummer eller i detta fall mätdata.

Spindel, en anledningen att jag fick vetskap om att de tagit data var att en mätleverantörerna hittade en besökare på sin sajt som kommit från den webbplats där TS lagt upp sin version av KIA-index. Detta användes som bevis.

Den systematiska tömningen bevisades med serverlogg.
Magnus_A är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-03-18, 22:38 #19
Draqir Draqir är inte uppkopplad
Medlem
 
Reg.datum: May 2009
Inlägg: 125
Draqir Draqir är inte uppkopplad
Medlem
 
Reg.datum: May 2009
Inlägg: 125
Citat:
Ursprungligen postat av Bjorne Visa inlägg
För det första stjäls inte information. För det andra är inte web scraping en form av attack. För det tredje, jo du kan visst enkelt undvika att bli scrapad. Utan att använda captcha. Försök scrapa google får du se.
Givetvis stjäl du information när du snor andras arbete som de har lagt ned tusentals timmar på. Vidare är det givetvis en attack i all dess innebörd om vi utgår från semantiken av ordet attack. Sen får du gärna berätta, hur du skyddar dig mot ett zombie nätverk av 100 000 datorer där du saknar ett fördefinerat söknings mönster och ett regelbundet tidsintervall emellan. Google har för övrigt redan blivit scrapad. Bättre lycka nästa gång!
Draqir är inte uppkopplad   Svara med citatSvara med citat
Oläst 2010-03-19, 07:52 #20
Erik Stenman Erik Stenman är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: Aug 2007
Inlägg: 2 154
Erik Stenman Erik Stenman är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: Aug 2007
Inlägg: 2 154
Frågan är om du överhuvud taget är något fel att ta informationen om den inte publiceras efteråt.

Sedan så är det väl inte olagligt med DDOS-attacker i Sverige? Har för mig att jag läste att det var "lagligt".
Erik Stenman är inte uppkopplad   Svara med citatSvara med citat
Svara


Aktiva användare som för närvarande tittar på det här ämnet: 1 (0 medlemmar och 1 gäster)
 

Regler för att posta
Du får inte posta nya ämnen
Du får inte posta svar
Du får inte posta bifogade filer
Du får inte redigera dina inlägg

BB-kod är
Smilies är
[IMG]-kod är
HTML-kod är av

Forumhopp


Alla tider är GMT +2. Klockan är nu 17:32.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson
 
Copyright © 2017