Postęp prac nad projektem: 24 Listopada 2021 – 21 Lutego 2022

1) Przeprowadzono obliczenia wartości całkowitej wewnętrznej sumy kwadratów (ang. total within sum of squares – wws) oraz indeksów Calińskiego i Harabasza (CHIndex). Na tej podstawie sporządzono wykresy zależności wartości wws i CHIndex od liczby skupień k dla każdej ze 100 stacji analizowanych stacji;

 

2) Uzyskane wykresy zmienności wartości wws i CHIndex przeanalizowano pod katem ustalenia optymalnej liczby skupień k. Dla zidentyfikowanych liczb skupień k przeprowadzono operację grupowaniu metodą k-średnich znormalizowanych hietogramów dla 100 zbiorów danych z poszczególnych deszczomierzy, z zastosowaniem metody bootstrap;

 

3) Przeanalizowano wyniki grupowania hietogramów metodą k-średnich dla poszczególnych stacji. Powtórzono obliczenia dla zredukowanej liczby skupień k w przypadku stacji, dla których nie udało się pierwotnie spełnić wymogu kryterium bootmean większego, bądź równego 0,6.

 

4) Ostatecznie dla każdej ze 100 stacji określono zbiór indywidualny hietogramów wzorcowych.

Powrót