1. Klasyfikacja jako przykład rozpoznawania wzorców

Dzisiejsze zajęcia poświęcimy rozpoznawaniu wzorców, a konkretnie, jego najczęściej pojawiającemu się problemowi, czyli zadaniu klasyfikacji. Zanim jednak zajmiemy się samą klasyfikacją, musimy wyjaśnić sobie czym jest wzorzec.

Pojęcie wzorca stosuje się często zamiennie z obiektem i próbką. Jest to zbiór cech zaobserwowanych w rzeczywistym obiekcie (najczęściej zmierzonych za pośrednictwem jakiegoś narzędzia pomiarowego), którymi staramy się go precyzyjnie opisać.

Za przykład posłużymy się kosaćcem, rodzajem kwiatów, które lepiej znamy pod nazwą irysów. W latach 30. XX wieku, amerykański botanik, Edgar Anderson, na potrzeby badań brytyjskiego biologa i statystyka Ronalda Fishera, dokonał pomiarów kwiatów z trzech gatunków tego rodzaju:

  • iris versicolor,

  • iris setosa,

  • iris virginica.

Wybrano po pięćdziesiąt kwiatów z każdego gatunku dla każdego z nich, tym samym narzędziem dokonano czterech pomiarów. Zmierzono długość i szerokość zarówno płatków, jak i kielichów, co dało sto pięćdziesiąt wzorców po cztery cechy. Utworzony w ten sposób został zbiór danych iris, który do dzisiaj jest jednym z najczęściej wykorzystywanych zbiorów benchmarkowych stosowanych w prezentacji wyników badań uczenia maszyn.

Zbiorem danych dla zadania klasyfikacji nazywamy więc kolekcję wzorców uzupełnionych o przypisania do poszczególnych grup—klas.

Last updated