1. Klasyfikacja jako przykład rozpoznawania wzorców
Last updated
Last updated
Dzisiejsze zajęcia poświęcimy rozpoznawaniu wzorców, a konkretnie, jego najczęściej pojawiającemu się problemowi, czyli zadaniu klasyfikacji. Zanim jednak zajmiemy się samą klasyfikacją, musimy wyjaśnić sobie czym jest wzorzec.
Pojęcie wzorca stosuje się często zamiennie z obiektem i próbką. Jest to zbiór cech zaobserwowanych w rzeczywistym obiekcie (najczęściej zmierzonych za pośrednictwem jakiegoś narzędzia pomiarowego), którymi staramy się go precyzyjnie opisać.
Za przykład posłużymy się kosaćcem, rodzajem kwiatów, które lepiej znamy pod nazwą irysów. W latach 30. XX wieku, amerykański botanik, Edgar Anderson, na potrzeby badań brytyjskiego biologa i statystyka Ronalda Fishera, dokonał pomiarów kwiatów z trzech gatunków tego rodzaju:
iris versicolor,
iris setosa,
iris virginica.
Wybrano po pięćdziesiąt kwiatów z każdego gatunku dla każdego z nich, tym samym narzędziem dokonano czterech pomiarów. Zmierzono długość i szerokość zarówno płatków, jak i kielichów, co dało sto pięćdziesiąt wzorców po cztery cechy. Utworzony w ten sposób został zbiór danych iris
, który do dzisiaj jest jednym z najczęściej wykorzystywanych zbiorów benchmarkowych stosowanych w prezentacji wyników badań uczenia maszyn.
Zbiorem danych dla zadania klasyfikacji nazywamy więc kolekcję wzorców uzupełnionych o przypisania do poszczególnych grup—klas.