Transcript slajdy.odp
Google Hacking Arkadiusz Firus a.firus[at]students.mimuw.edu.pl Google hacking ● Historia ● Usługi ● Jak pytać ● Co można znaleźć ● Jak się bronić ● Ciekawostki Idea Google Misją Google jest uporządkowanie światowych zasobów informacji, aby stały się one powszechnie dostępne i użyteczne. Do no evil Zbudujmy narzędzie, które będzie popularne. Zyski przyjdą same. Historia ← Założyciele → Larry Page Przewodniczący ↓ Sergey Brin Dr. Eric Schmidt http://www.google.com/intl/en/corporate/history.html Oferowane usługi ● Wyszukiwarki ● Dodatki dla webmasterów ● Aplikacje ● Google dla firm ● Google na komórki http://www.google.com/press/descriptions.html Dodatki dla webmasterów http://www.google.com/webmasters/tools http://www.google.com/a Możliwości wyszukiwarki ● Pamięć podręczna dla stron ● Kalkulator ● Definicje ● Typy plików ● Szczęśliwy traf ● Ładowanie z wyprzedzeniem (firefox) Możliwości wyszukiwarki (2) ● Podobne strony ● Wyszukiwanie w witrynie ● Połączone witryny ● Sprawdzanie pisowni ● Tłumaczenie stron ● Konwersja do html Cechy wyszukiwarki ● Wielkość liter jest bez znaczenia ● Automatyczny iloczyn (AND) ● ● ● Automatyczne usunięcie popularnych słów („how”, „and”, ...) Ignorowanie (choć nie do końca) znaków narodowych („ladny” = „ładny” + „ladny”) Odmiana wyrazów. Podstawowe operatory | (pipe lub „OR”) - (minus) + (plus) ~ (tylda) „wyrażenie” * (gwiazdka) . (kropka) - alternatywa - wykluczenie wyrazu - wyraz musi być w wyniku - wyrazy bliskoznaczne (dla polskiego języka działa słabo) - szukamy dokładnego wyrażenia - dowolny ciąg słów - zastępuje spację Można (a nawet należy) używać nawiasowania do ustalenia priorytetów. Operatory zaawansowane cache: - kopia lokalna link: - linki do related: - strony podobne do info: - informacje o define: - definicja słowa site: - tylko w danej domenie [all]intitle: - fraza muszą być w tytule [all]inurl: - fraza musi być w URL [all]intext - fraza musi być w tekście [all]inanchor - fraza musi być w odnośnikach filetype: - tylko pliki/w plikach danego typu http://www.google.com/help/operators.html Struktura URL http://www.google.pl/search? q=Uniwersytet+Warszawski&ie=utf-8&oe=utf8&client=firefox-a&hl=pl&bl=lang_pl ? & q ie oe client num hl lr bntl strip=1 - po nim podajemy parametry - rozdziela parametry - nasze zapytanie - kodowanie wejściowe - kodowanie wyjściowe - nazwa klienta - limit wyników na stronie - język przegladarki - wyniki tylko w języku (np. lang_pl) - szczęśliwy traf - sam tekst (tylko kopia lokalna) Co nas interesuje? 1) Pliki z loginami lub hasłami: passwd, shadow, htaccess, htpasswd, htusers, ... 2)Kopie zapasowe: rozszerzenia bak, old, ... 3) Logi: rozszerzenie log lub np. bash_history Co nas interesuje? 4) Strony urządzeń sieciowych inurl:hp/device/this.LCDispatcher 5) Wulgaryzmy występują często w wersjach testowych 6) Plików robots.txt (o tym później) 7) Adresy e-mailowe to głównie dla spamerów Przykładowe zapytania intitle:index.of chopin (mp3|wav|ogg|flac) ciekawe czy dużo osób słucha Chopina? http://admin: * @www hasełka do stron internetowych intitle:index.of site:mimuw.edu.pl komu nie chciało się utworzyć pliku index.html? Do czego jeszcze można wykorzystać google 1) Anonimowe Proxy 2) DNS Discovering 3) Obchodzenie zabezpieczeń podszywamy się pod googlebot'a Google Kalendarz 1) Ludzie zmieniają hasła change password 2) Klucze WEP WEP 3) Popodsłuchujemy troche? passcode Jak się bronić? 1) Polityka bezpieczeństwa edukacja pracowników 2) Prawa dostępu do plików 3) Zmieniamy standardowe nazwy (np. „Index of”) lub tworzymy plik index.html 4) Sami odpytujemy niechciane pozycje. google i usuwamy Jak się bronić? 5) Instruujemy roboty robots.txt <meta name=”robots” content=”noindex, nofollow, noarchive”> <meta name=”googlebot” content=j. w.> <a href=”www.wp.pl” rel=”nofollow”> 6) Ostatnie, ale najważniejsze: MYŚLIMY Search Engine Optimalization, czyli jak być pierwszym ● Domena ● Dobrze napisana strona: ● – jak najbliżej standardu – używanie tagów <strong> <em> <i> <u> – dobrze opisane linki Linki z innych stron (najlepiej o wysokim PageRank) Ciekawostki Ciekawostki the answer to life, the universe and everything Więcej informacji ● http://blog.konieczny.be/ ● http://johnny.ihackstuff.com/ ● http://googleblog.blogspot.com/ ● http://google.com/