Czym jest klasyfikacja stron internetowych?

Klasyfikacja stron internetowych jest coraz częściej wykorzystywana przez organizacje, które chcą usprawnić i zoptymalizować swoje działania. W połączeniu ze sztuczną inteligencją ma realny wpływ na bezpieczeństwo przepływu danych, a także na zarządzanie organizacją. Przykładem klasyfikacji stron WWW jest rozwiązanie BTC Website Classification.

Jak działa BTC Website Classification?

BTC Website Classification to szybki i skuteczny proces analizy i kategoryzacji każdej strony odwiedzanej przez użytkownika. Klasyfikator poprzez monitorowanie aktywności pracowników określa, czy podejmowane przez nich działania są efektywne i produktywne. Co więcej, dzięki szczegółowej analizie bezpieczeństwa, zapewnia automatyczne wykrywanie potencjalnych zagrożeń, przez co pomaga zabezpieczyć firmę przed celowym lub przypadkowym wyciekiem danych.

Klasyfikator stron internetowych BTC do analizy adresów URL wykorzystuje dwie metody. Pierwsza z nich – machine learning analizuje treść na podstawie słów kluczowych. Deep learning analizuje całą stronę i jest w stanie zrozumieć kontekst, przez co zapewnia jeszcze sprawniejszą klasyfikację.

W BTC Website Classification cały proces klasyfikacji przebiega w pełni automatycznie. Klasyfikator sprawdza, czy strona posiada dane tekstowe, na których podstawie może przeprowadzić kategoryzację. Za pomocą sztucznej inteligencji, określa przypisaną do strony kategorię oraz współczynnik pewności wyboru przez algorytm danej kategorii, jeżeli jest wysoki, to z dużym prawdopodobieństwem algorytm zadziałał prawidłowo, wskazując na rzeczywistą kategorię, do której odnosi się strona. Klasyfikator wskazuje też, czy analizowany adres URL jest produktywny.

Klasyfikator przeprowadza szczegółową analizę bezpieczeństwa, w której trakcie sprawdza m.in. takie elementy, jak struktura strony, obecność certyfikatu SSL, zawieranie przekierowań, oraz co szczególnie istotnie pod względem bezpieczeństwa – obecność w bazach i rejestrach stron niebezpiecznych. Finalnie, klasyfikator przedstawia dwie kategorie, otrzymane za pomocą dwóch technologii, a także dokładną analizę bezpieczeństwa i rekomendację wraz z pewnością wyniku.

BTC Website Classification to rozwiązanie stworzone z myślą o optymalizacji i automatyzacji kluczowych działań. Administratorzy w jednym miejscu zyskują szczegółowe informacje na temat stron WWW odwiedzanych przez pracowników, w tym kwestie bezpieczeństwa i produktywności.

Schemat działania BTC Website Classification

TOP WWW według BTC Website Classification

Organizacje, które chcą zagwarantować bezpieczeństwo, a przy tym zautomatyzować działania i kluczowe procesy muszą postawić na sprawdzone, przejrzyste i co najważniejsze – innowacyjne rozwiązania. Dokładnie takie jest rozwiązanie BTC Website Classification, które każdego dnia analizuje setki nowych adresów URL, odpowiednio je kategoryzując, a także sprawdzając, czy są bezpieczne i produktywne.

Wskazujemy najpopularniejsze kategorie i strony internetowe według liczby ich zapytań. Bezpieczeństwo to podstawa, dlatego też sprawdziliśmy, jaki procent wśród odwiedzanych w ostatnim miesiącu stron, stanowią te, które mogą być potencjalnie niebezpieczne.*

BTC AI Najpopularniejsze kategorie stron WWW

Usługi internetowe i komunikacja, to kategoria, która w sierpniu była najczęściej wyszukiwana. Prawie połowa liczby zapytań o adresy URL, bo ponad 45% dotyczyło stron o tej tematyce.

Zapytania o kategorię stron o tematyce komputerów, oprogramowań i elektroniki w odniesieniu do całości stanowiły ponad 12%.

Wyszukiwania stron o kategorii polityki, prawa i instytucji rządowych pojawiały się sporadycznie, w odniesieniu do całości wynik stanowi 8%, a stron dotyczących zakupów i ogłoszeń 6%.

Pozostałe strony o kategorii przemysłu i biznesu, mediów i wiadomości, turystyki, a także sportu i rozrywki stanowiły mniej niż 5%.

BTC AI Najpopularniejsze strony WWW

Czy odwiedzane strony są bezpieczne?

W kwestii bezpieczeństwa przeanalizowaliśmy, ile odwiedzanych przez użytkowników stron WWW ma nieaktualny certyfikat SSL, ile z nich zawiera przekierowania do innych stron, a także ile z nich ma niebezpieczną strukturę.

12% stron internetowych odwiedzanych przez użytkowników systemu posiada nieważny certyfikat SSL, a 19% analizowanych witryn ma niebezpieczną strukturę. Znikoma ilość uruchamianych adresów URL zawiera przekierowania, bo zaledwie 0,1% stron.

Otrzymane wyniki najpopularniejszych kategorii, stron WWW i kwestii bezpieczeństwa są optymistyczne. Pracownicy najczęściej odwiedzają kategorie witryn związanych z usługami internetowymi. Strony rozrywkowe, które rozpraszają użytkowników w pracy, stanowią zalewnie ułamek kilku procent.

*Statystyki dotyczą okresu od 01.08.2021 – 31.08.2021 r.

BTC Projekt EU