Geoinformace v prostředí sociálních sítí

Transkript

Geoinformace v prostředí sociálních sítí
GEOINFORMACE V PROSTŘEDÍ
SOCIÁLNÍCH SÍTÍ
Dana FUSKOVÁ
Vedoucí práce: Mgr. Lukáš MAREK
www.geoinformatics.upol.cz
SOCIÁLNÍ SÍTĚ
• Primárně geosociální sítě – geolokační sítě
–
–
–
–
Foursquare
Couchsurfing
Google places
I just made love
• Sociální sítě s prostorovou složkou, nebo geolokací
– Facebook, Twitter, Google+
– Instagram, Flickr, Panorama
• Sociální sítě s prostorovým atributem
–
–
–
–
LinkedIn
ČSFD / IMDb
Youtube, MySpace
Spolužáci
www.geoinformatics.upol.cz
SOCIÁLNÍ SÍTĚ
Země
1. místo
2. místo
3. místo
4. místo
5. místo
ČR
Facebook
YouTube
LinkedIn
Lidé
Twitter
Slovensko
Facebook
YouTube
LinkedIn
Tumblr
Twitter
Austrálie
Facebook
YouTube
LinkedIn
Twitter
Pinterest
Brazílie
Facebook
YouTube
LinkedIn
Twitter
Instagram
Čína
Qzone
Sina Weibo
Renren
Douban
PengYou
Egypt
Facebook
YouTube
Twitter
Vube.com
Ask.fm
Indie
Facebook
YouTube
LinkedIn
Twitter
Pinterest
Japonsko
YouTube
Facebook
Twitter
Mixi
Ameba
Jižní Afrika
Facebook
YouTube
LinkedIn
Twitter
Pinterest
Německo
Facebook
YouTube
Xing
LinkedIn
Tumblr
Nizozemsko
Facebook
YouTube
LinkedIn
Twitter
Tumblr
Polsko
Facebook
YouTube
LinkedIn
Tumblr
Vube.com
Rusko
Vkontakte
Odnoklassniki
Facebook
LiveInternet
LiveJournal
Španělsko
Facebook
YouTube
Twitter
LinkedIn
Tumblr
USA
Facebook
YouTube
LinkedIn
Twitter
Pinterest
Velká Británie
Facebook
YouTube
LinkedIn
Twitter
Tumblr
www.geoinformatics.upol.cz
DATA MINING
Proces vyšší úrovně získávání informací
prostřednictvím dolování dat a to společně s
přípravou před dobýváním znalostí až po
následnou prezentaci.
www.geoinformatics.upol.cz
DOLOVACÍ PROSTŘEDKY
•
API
– Twitter (dev.twitter.com)
– Facebook (developers.facebook.com)
– LinkedIn (developer.linkedin.com)
•
Web scraping
– Mozenda
– Web-Harvest
•
Komerční / Open source nástroje
–
–
–
–
WEKA
Pajek
Rapid Miner
R – knihovny – rFacebook, TwitteR, rGoogleVis, igraph…
www.geoinformatics.upol.cz
VIZUALIZACE DAT ZE SOC. SÍTÍ
• ArcGIS
– Social Media
– Chrome-Twitter
• R
• Placebook
• GeoSocialAggregator
• A jiné
www.geoinformatics.upol.cz
TWITTER
• Proces autorizace
– consumer Key, consumer secret
• Prostředí a jazyk R
– Knihovny: OAuth, twitteR, streamR,
• API
– 3 části (Search API, Streamin API, REST API)
– Search API
• twitteR
– searchTwitter
uk100<-searchTwitter('#sochi', geocode='30.52,50.46,100km',
cainfo="cacert.pem")
www.geoinformatics.upol.cz
TWITTER
Streaming API
• streamR
– filterStream
filterStream(file.name="ukraine1603.json", track=c("#crimea",
"#ukraine"), timeout=3600, oauth=twitCred)
• „lat“, „lon“
• „location“
– geokódování
www.geoinformatics.upol.cz
TWITTER
Datum
Počet
Počet
sběru
získaných
tweetů s
tweetů
tweetů
geolokací
16.3.2014
17.3.2014
18.3.2014
19.3.2014
20.3.2014
21.3.2014
22.3.2014
23.3.2014
24.3.2014
25.3.2014
26.3.2014
27.3.2014
28.3.2014
29.3.2014
30.3.2014
25 822
9 376
17 868
13 705
41 241
12 546
15 847
11 074
19 297
25 444
15 230
17 107
7 666
12 869
17 401
www.geoinformatics.upol.cz
269
94
150
85
313
114
125
136
238
132
125
136
59
83
103
Velikost
Velikost
Počet
geokódovaných
tweetů
JSON před
geokódováním [kb]
GeoJSON po
geokódování [kB]
13 660
4 690
7 642
6 230
13 449
5 581
6 971
5 331
8 535
9 253
7 446
7 554
3 159
5 533
7 151
115 291
94 817
78 182
59 298
192 346
54 861
73 119
49 643
80 658
115 939
66 946
97 135
34 745
64 163
78 380
12 302
4 199
6 944
5 704
12 168
5 115
6 255
4 832
7 770
8 228
6 844
6 912
2 906
4 965
6 567
www.geoinformatics.upol.cz
www.geoinformatics.upol.cz
FACEBOOK
• Autorizace
– User Acess Token , App Acess Token, Page Acess Token, Klient Token
• Prostředí R
– rFacebook, Oauth
• Přátelé
– GEOLOKACE - hometown , location
pratele <- getFriends(token, simplify = TRUE)
pratele_info <- getUsers(pratele$id, token, private_info = TRUE)
• Veřejné příspěvky
– locale
www.geoinformatics.upol.cz
FACEBOOK
www.geoinformatics.upol.cz
FACEBOOK
www.geoinformatics.upol.cz
LinkedIn
• JavaScript API
• REST API
– IPython
• Pouze textový prostorový prvek
• Mladé API
• Informace vztažené pouze ke konkrétnímu uživateli
www.geoinformatics.upol.cz
DATA a jejich problémy
• Twitter
–
–
–
–
42 proměnných
Pouze 1% geolokovaných
Parametr: Location
Různé znaky netextového charakteru
• Facebook
– Pouze 1-3% geolokovaných
– Není atribut pro samostatnou geolokaci
• LinkedIn
– Mladé API
– Geoinformace pouze ve formě textu
www.geoinformatics.upol.cz
VÝSLEDKY
• Postupy a metody pro zisk dat ze sociálních sítí
• Popisy tří vybraných sociálních sítí a jejich API
• Případové studie
– Krize na Ukrajině a Twitter (262 493 tweetů)
– Facebook – přátelé a veřejné příspěvky
• Skripty v R a programový kód Python
www.geoinformatics.upol.cz
Děkuji za pozornost
www.geoinformatics.upol.cz

Podobné dokumenty

SOCIÁLNÍ SÍTĚ

SOCIÁLNÍ SÍTĚ SOCIÁLNÍ SÍTĚ Využití sociálních sítí: firmami:

Více

Live Maps (Bing Maps)

Live Maps (Bing Maps)  Bing Maps developer account s pomocí Windows Live ID  Vygenerovat Bing Maps key, tedy klíč, nutný k práci s naší webovou aplikací  Silverlight  Bing maps platformy:  Silverlight Map Control I...

Více

PDF verze - Hroch - VOŠ a SPŠE Olomouc

PDF verze - Hroch - VOŠ a SPŠE Olomouc Procesy Proces (program) Proces (anglicky process) je v informatice název pro spuštěný počítačový program. Proces je umístěn v operační paměti počítače v podobě sledu strojových instrukcí vykonávan...

Více

Dokumentace k API SSLmarketu

Dokumentace k API SSLmarketu Dokumentace k API SSLmarketu verze 1.3

Více

Možnosti propagace na portálu Vinegret.cz

Možnosti propagace na portálu Vinegret.cz Partnerství a spolupráce se čtenáři

Více

zadání tutoriálu

zadání tutoriálu V minulém dı́le tutoriálu jsme se seznámili se základnı́mi pravidly syntaxe a programovanı́ v jazyce Python. Popularita tohoto jazyka však nepramenı́ pouze z velmi pohodlné syntaxe, ale také...

Více

7 divů světa metodika

7 divů světa metodika Anotace: Prezentace a pracovní listy jsou určeny k prohloubení a upevnění znalostí o antické kultuře, konkrétně divech světa. Druh učebního materiálu: Výuková prezentace a pracovní list Očekávaný v...

Více

kapitoly z kvalitativního výzkumu

kapitoly z kvalitativního výzkumu Jde o specifický přístup k vytváření a analýze kulturních dat v rámci kognitivní antropologie, s jehož názvem se studenti často setkávají, ale pro mnohé z nich zůstává zahalen rouškou tajemství. Sm...

Více