Kuvioiden tunnistusjärjestelmät maailman tietoresursseissa. Katsaus olemassa oleviin muodontunnistusmenetelmiin. Esimerkkejä hahmontunnistusongelmista

Luku 3: Pattern Recognition (Identification) -järjestelmät

  • Kuvan käsite. Oppimismallin tunnistamisen ongelma. Geometriset ja rakenteelliset lähestymistavat. kompaktiuden hypoteesi. Koulutus ja itseopiskelu. sopeutuminen ja oppiminen.
  • Kuviontunnistuksen oppimismenetelmät - perceptronit, hermoverkot, potentiaalisten funktioiden menetelmä, argumenttien ryhmälaskennan menetelmä, yksinkertaistamista rajoittava menetelmä, päätössääntöjen ryhmät.
  • Menetelmät ja algoritmit moniulotteisen datan rakenteen analysointiin - klusterianalyysi, hierarkkinen ryhmittely.

Kuvan käsite

Kuva, luokka - luokitusjärjestelmässä oleva luokitusryhmä, joka yhdistää (erottaa) tietyn objektiryhmän jonkin attribuutin mukaan.

Kuvannollinen maailmankäsitys on yksi elävien aivojen salaperäisistä ominaisuuksista, joka mahdollistaa havaitun tiedon loputtoman virran ymmärtämisen ja suuntautumisen ylläpitämisen ulkomaailman erilaisten tietojen valtameressä. Havaittaessa ulkomaailmaa luokittelemme havaitut aistimukset aina, eli jaamme ne samanlaisten mutta ei identtisten ilmiöiden ryhmiin. Merkittävästä erosta huolimatta yhteen ryhmään kuuluvat esimerkiksi kaikki eri käsialalla kirjoitetut kirjaimet A tai kaikki samaa nuottia vastaavat äänet, otettuna millä tahansa oktaavilla ja millä tahansa instrumentilla, sekä teknistä kohdetta ohjaava operaattori kokonaisuutena. tilojen joukko -objekti reagoi samalla reaktiolla. Tyypillistä on, että tietyn luokan käsitysryhmän käsitteen muodostamiseksi riittää, että tutustutaan pieneen määrään sen edustajia. Lapselle voidaan näyttää vain kerran kirjain, jotta hän löytää tämän kirjaimen eri fonteilla kirjoitetusta tekstistä tai tunnistaa sen, vaikka se olisi kirjoitettu tarkoituksella vääristetyssä muodossa. Tämä aivojen ominaisuus antaa meille mahdollisuuden muotoilla sellaisen käsitteen kuvana.

Kuvilla on tyypillinen ominaisuus, joka ilmenee siinä, että tutustuminen äärelliseen määrään ilmiöitä samasta joukosta mahdollistaa mielivaltaisen suuren joukon sen edustajia. Esimerkkejä kuvista voivat olla: joki, meri, neste, Tšaikovskin musiikki, Majakovskin runot jne. Ohjausobjektin tiettyä tilajoukkoa voidaan pitää myös kuvana, ja tälle koko tilajoukolle on ominaista se, että tietyn tavoitteen saavuttamiseksi, sama vaikutus kohteeseen. Kuvilla on ominaisia ​​objektiivisia ominaisuuksia siinä mielessä, että erilaisesta havaintomateriaalista oppivat ihmiset luokittelevat suurimmaksi osaksi samat kohteet samalla tavalla ja toisistaan ​​riippumatta. Juuri tämä kuvien objektiivisuus antaa ihmisille kaikkialla maailmassa ymmärtää toisiaan.

Kyky havaita ulkoinen maailma kuvien muodossa mahdollistaa sen, että tunnistaa tietyllä varmuudella äärettömän määrän esineitä, jotka perustuvat tutustumiseen niiden äärelliseen määrään, ja kuvien pääominaisuuden objektiivinen luonne mahdollistaa sen mallintamisen tunnistamisprosessia. Objektiivisen todellisuuden heijastuksena kuvan käsite on yhtä objektiivinen kuin todellisuus itse, ja siksi tämä käsite voi itsessään olla erityisen tutkimuksen kohteena.

Koulutusmallintunnistuksen (ORO) ongelmalle omistetussa kirjallisuudessa esitellään usein luokan käsite kuvan käsitteen sijaan.

Learning Pattern Recognition (ORO) -ongelma

Yksi ihmisaivojen mielenkiintoisimmista ominaisuuksista on kyky vastata äärettömään määrään ympäristöolosuhteita rajallisella määrällä reaktioita. Ehkä juuri tämä ominaisuus antoi ihmisen saavuttaa elävän aineen korkeimman olemassaolon muodon, joka ilmaistaan ​​kyvyssä ajatella, eli heijastaa aktiivisesti objektiivista maailmaa kuvien, käsitteiden, tuomioiden jne. muodossa. Siksi ongelma ORO syntyi tutkittaessa aivojen fysiologisia ominaisuuksia.

Harkitse esimerkkiä ODP-alueen tehtävistä.


Riisi. yksi

Tässä on 12 tehtävää, joissa on tarpeen valita ominaisuuksia, joiden avulla voidaan erottaa vasen kuvakolmio oikeasta. Näiden ongelmien ratkaiseminen edellyttää loogisen ajattelun mallintamista kokonaisuudessaan.

Yleensä kuviontunnistusongelma koostuu kahdesta osasta: oppimisesta ja tunnistamisesta. Koulutus toteutetaan näyttämällä yksittäisiä esineitä osoituksena niiden kuulumisesta yhteen tai toiseen kuvaan. Harjoittelun tuloksena tunnistusjärjestelmän tulee hankkia kyky reagoida samoilla reaktioilla kaikkiin saman kuvan esineisiin ja eri reaktioihin kaikkiin eri kuvien esineisiin. On erittäin tärkeää, että oppimisprosessi päättyy vain rajallisen määrän kohteiden näyttämiseen ilman muita kehotteita. Oppimisobjekteina voivat olla joko kuvia tai muita visuaalisia kuvia (kirjaimia), tai erilaisia ​​ulkomaailman ilmiöitä, esimerkiksi äänet, kehon tila lääketieteellisen diagnoosin aikana, teknisen kohteen tila ohjausjärjestelmissä, jne. On tärkeää, että vain esineet ja niiden kuuluvuus kuvaan. Koulutusta seuraa uusien kohteiden tunnistusprosessi, joka luonnehtii jo koulutetun järjestelmän toimintaa. Näiden toimenpiteiden automatisointi on hahmontunnistuksen koulutuksen ongelma. Siinä tapauksessa, että henkilö itse arvaa tai keksii ja sitten asettaa koneelle luokittelusäännön, tunnistusongelma ratkeaa osittain, koska henkilö ottaa pää- ja pääosan ongelmasta (koulutuksesta).

Kuviontunnistuksen koulutuksen ongelma on mielenkiintoinen sekä soveltavalta että perustavanlaatuisesta näkökulmasta. Sovelletusta näkökulmasta tämän ongelman ratkaiseminen on tärkeä ennen kaikkea siksi, että se avaa mahdollisuuden automatisoida monia prosesseja, jotka tähän asti ovat liittyneet vain elävien aivojen toimintaan. Ongelman perustavanlaatuinen merkitys liittyy läheisesti kybernetiikan ideakehityksen yhteydessä nousevaan kysymykseen: mitä kone pystyy ja mitä pohjimmiltaan ei? Missä määrin koneen kykyjä voidaan lähentää elävien aivojen kykyjä? Voiko kone erityisesti kehittää kykyä ottaa ihmiseltä kyky suorittaa tiettyjä toimintoja ympäristössä syntyvistä tilanteista riippuen? Toistaiseksi on käynyt selväksi vain, että jos ihminen osaa ensin itse toteuttaa kykynsä ja sitten kuvailla sitä, eli osoittaa, miksi hän tekee toimia vasteena jokaiseen ulkoisen ympäristön tilaan tai kuinka (millä säännöllä) hän yhdistää yksilön objektit kuviksi, niin tällainen taito voidaan siirtää koneeseen ilman perustavanlaatuisia vaikeuksia. Jos ihmisellä on taito, mutta hän ei osaa selittää sitä, on vain yksi tapa siirtää taito koneelle - oppiminen esimerkein.

Tunnistusjärjestelmien avulla ratkaistavissa olevien tehtävien kirjo on erittäin laaja. Tämä ei sisällä vain visuaalisen ja kuulokuvan tunnistamisen tehtäviä, vaan myös monimutkaisten prosessien ja ilmiöiden tunnistamisen tehtäviä, joita syntyy esimerkiksi valittaessa yrityksen johtajan asianmukaisia ​​toimia tai valittaessa optimaalista teknologista, taloudellista, liikennettä. tai sotilaallisiin operaatioihin. Jokaisessa näistä tehtävistä analysoidaan joitain ulkomaailman ilmiöitä, prosesseja, tiloja, joita kutsutaan jäljempänä havainnointikohteiksi. Ennen kuin aloitat minkä tahansa kohteen analyysin, siitä on jollakin tavalla hankittava tiettyä, järjestettyä tietoa. Tällainen tieto on ominaisuus esineille, niiden näyttö tunnistusjärjestelmän havaitsevien elinten joukossa.

Mutta jokainen havaintokohde voi toimia eri tavalla havaintoolosuhteista riippuen. Esimerkiksi mikä tahansa kirjain, jopa samalla tavalla kirjoitettu, voidaan periaatteessa siirtää millä tahansa tavalla suhteessa havaitseviin elimiin. Lisäksi saman kuvan kohteet voivat olla hyvin erilaisia ​​keskenään ja tietysti vaikuttaa havainnointielimiin eri tavoin.

Jokaista minkä tahansa kohteen kartoittamista tunnistusjärjestelmän havaitseviin elimiin, riippumatta sen sijainnista näihin elimiin nähden, kutsutaan yleensä kohteen kuvaksi, ja tällaisten kuvien joukot, joita yhdistävät eräät yhteiset ominaisuudet, ovat kuvia.

Kun ohjausongelmia ratkaistaan ​​kuvantunnistusmenetelmillä, käytetään termiä "tila" termin "image" sijaan. Tila on tietynlainen muoto, jolla näytetään havaitun kohteen mitatut virta- (tai hetkelliset) ominaisuudet. Tilan joukko määrää tilanteen. Käsite "tilanne" on analoginen käsite "image" kanssa. Mutta tämä analogia ei ole täydellinen, koska jokaista kuvaa ei voida kutsua tilanteeksi, vaikka jokaista tilannetta voidaan kutsua kuvaksi.

Tilannetta kutsutaan yleensä tietyksi monimutkaisen objektin tilojen joukkoksi, joille jokaiselle on tunnusomaista kohteen samat tai samankaltaiset ominaisuudet. Esimerkiksi, jos tiettyä ohjausobjektia pidetään havainnointikohteena, niin tilanne yhdistää tämän kohteen sellaiset tilat, joissa tulee käyttää samoja ohjaustoimenpiteitä. Jos tarkkailukohteena on sotilaspeli, niin tilanne yhdistää kaikki pelin tilat, jotka vaativat esimerkiksi voimakkaan panssariiskun ilmatuella.

Kohteiden alkuperäisen kuvauksen valinta on yksi ODP-ongelman keskeisistä tehtävistä. Alkukuvauksen (ominaisuusavaruuden) onnistuneella valinnalla tunnistustehtävä voi osoittautua triviaaliksi, ja päinvastoin, epäonnistunut alkukuvaus voi johtaa joko erittäin vaikeaan tiedon jatkokäsittelyyn tai ratkaisun puuttumiseen. ollenkaan. Jos esimerkiksi ratkaistaan ​​väriltään poikkeavien esineiden tunnistamisongelma ja alkukuvaukseksi valitaan paino-antureilta tulevat signaalit, niin tunnistusongelmaa ei periaatteessa voida ratkaista.

Geometriset ja rakenteelliset lähestymistavat.

Joka kerta kun kohtaamme tuntemattomia ongelmia, on luonnollinen halu esittää ne jonkin helposti ymmärrettävän mallin muodossa, jonka avulla voisimme ymmärtää ongelman mielikuvituksemme helposti toistettavissa termeissä. Ja koska olemme olemassa tilassa ja ajassa, meille ymmärrettävin on tehtävien tila-ajallinen tulkinta.

Mikä tahansa kuva, joka syntyy oppimis- tai tenttiprosessin kohteen havainnoinnin seurauksena, voidaan esittää vektorina ja siten pisteenä jossain piirreavaruudessa. Jos väitetään, että kuvia esitettäessä on mahdollista yksiselitteisesti liittää ne yhteen kahdesta (tai useammasta) kuvasta, niin väitetään, että jossain tilassa on kaksi (tai useampia) alueita, joilla ei ole yhteisiä pisteitä. , ja että kuvat ovat pisteitä näiltä alueilta. Jokaiselle tällaiselle alueelle voidaan antaa nimi, eli antaa kuvaa vastaava nimi.

Tulkikaamme nyt kuviontunnistuksen oppimisprosessia geometrisen kuvan avulla, rajoittuen toistaiseksi tapaukseen, jossa tunnistetaan vain kaksi kuviota. Ennakolta oletetaan vain, että jossain tilassa on erotettava kaksi aluetta ja että vain pisteet näistä alueista näytetään. Nämä alueet itsessään eivät ole ennalta määrättyjä, eli ei ole tietoa niiden rajojen sijainnista tai sääntöjä sen määrittämiseksi, kuuluuko piste tietylle alueelle.

Koulutuksen aikana esitellään näiltä alueilta satunnaisesti valittuja pisteitä ja raportoidaan, mille alueelle esitetyt pisteet kuuluvat. Näistä alueista, eli niiden rajojen sijainnista, ei koulutuksen aikana anneta lisätietoa. Oppimisen tavoitteena on joko rakentaa pinta, joka erottaa paitsi oppimisprosessissa näkyvät pisteet, myös kaikki muut näihin alueisiin kuuluvat pisteet, tai rakentaa näitä alueita rajoittavia pintoja siten, että jokainen niistä sisältää vain sama kuva. Toisin sanoen oppimisen tavoitteena on rakentaa kuvavektoreista sellaisia ​​funktioita, jotka olisivat esimerkiksi positiivisia yhden kuvan kaikissa kohdissa ja negatiivisia toisen kuvan kaikissa kohdissa. Koska alueilla ei ole yhteisiä pisteitä, tällaisia ​​erottavia toimintoja on aina kokonainen joukko, ja oppimisen seurauksena yksi niistä on rakennettava.

Jos esitetyt kuvat eivät kuulu kahteen, vaan suurempaan määrään kuvia, niin tehtävänä on rakentaa harjoituksen aikana esitettyjen pisteiden mukaan pinta, joka erottaa kaikki näitä kuvia vastaavat alueet toisistaan. Tämä ongelma voidaan ratkaista esimerkiksi rakentamalla funktio, joka ottaa saman arvon kunkin alueen pisteiden yli, ja tämän funktion arvon eri alueiden pisteille tulisi olla erilainen.



Riisi. 2 - Kaksi kuvaa.

Ensi silmäyksellä näyttää siltä, ​​että vain tietyn pistemäärän tietäminen alueelta ei riitä erottamaan koko aluetta. Näitä pisteitä sisältäviä alueita voidaan todellakin määrittää lukemattomia määriä, ja riippumatta siitä, kuinka alueen valitseva pinta on rakennettu niistä, on aina mahdollista määrittää toinen alue, joka leikkaa pinnan ja sisältää samalla pisteet näytetään. Tiedetään kuitenkin, että ongelma funktion approksimoimisessa sitä koskevista tiedoista rajoitetussa pistejoukossa, joka on paljon kapeampi kuin koko joukko, jolle funktio annetaan, on yleinen funktioiden approksimoinnin matemaattinen ongelma. Tietenkin tällaisten ongelmien ratkaiseminen edellyttää tiettyjen rajoitusten käyttöönottoa tarkasteltavana olevan toimintoluokan osalta, ja näiden rajoitusten valinta riippuu niiden tietojen luonteesta, joita opettaja voi lisätä oppimisprosessiin. Yksi tällainen vihje on kuvitelma kuvien kompaktisuudesta. On intuitiivisesti selvää, että erotusfunktion approksimaatio on helpompi tehtävä, mitä kompaktimpia ja erillään erotettavat alueet ovat. Joten esimerkiksi kuvassa 2 esitetyssä tapauksessa. Kuviossa 2a erottelu on selvästi yksinkertaisempaa kuin kuvassa 2a esitetyssä tapauksessa. 2b. Todellakin, kuviossa esitetyssä tapauksessa. Kuviossa 2a alueet voidaan erottaa tasolla, ja vaikka erotusfunktion määrittelyssä olisi suuria virheitä, se jatkaa alueiden erottamista. Kuvan tapauksessa Kuviossa 2b erottelu suoritetaan monimutkaisen pinnan avulla ja pienetkin poikkeamat sen muodossa johtavat erotusvirheisiin. Juuri tämä intuitiivinen käsitys suhteellisen helposti erotettavissa olevista alueista johti kompaktiuden olettamukseen.

Kuvioiden tunnistamisen oppimisen ongelman geometrisen tulkinnan rinnalla on toinenkin lähestymistapa, jota kutsutaan rakenteelliseksi tai kielelliseksi. Selitämme kielellistä lähestymistapaa visuaalisen kuvantunnistuksen esimerkin avulla. Ensin erotetaan joukko alkukäsitteitä - kuvista löydetyt tyypilliset fragmentit ja fragmenttien keskinäisen järjestelyn ominaisuudet - "vasemmalla", "alhaalla", "sisällä" jne. Nämä alkuperäiset käsitteet muodostavat sanakirjan, jonka avulla voit rakentaa erilaisia ​​loogisia väitteitä, joita joskus kutsutaan oletuksiksi. Tehtävänä on valita suuresta määrästä väitteitä, jotka voitaisiin rakentaa näiden käsitteiden avulla, jotka ovat tässä tapauksessa merkittävimmät.

Lisäksi tarkasteltaessa äärellistä ja, jos mahdollista, pientä määrää esineitä kustakin kuvasta, on tarpeen rakentaa kuvaus näistä kuvista. Rakennettujen kuvausten tulee olla niin täydellisiä, että ne ratkaisevat kysymyksen, mihin kuvaan annettu esine kuuluu. Kielellistä lähestymistapaa toteutettaessa syntyy kaksi ongelmaa: alkusanakirjan eli tyypillisten fragmenttien joukon muodostamisen ongelma ja kuvaussääntöjen rakentamisen ongelma tietyn sanakirjan elementeistä.

Kielellisen tulkinnan puitteissa vedetään analogia kuvien rakenteen ja kielen syntaksin välille. Halu tähän analogiaan johtui mahdollisuudesta käyttää matemaattisen kielitieteen laitteistoa, eli menetelmät ovat luonteeltaan syntaktisia. Matemaattisen kielitieteen laitteiston käyttöä kuvien rakenteen kuvaamiseen voidaan soveltaa vasta, kun kuvat on segmentoitu sen osiin eli on kehitetty sanoja kuvaamaan tyypillisiä fragmentteja ja menetelmiä niiden etsimiseen. Sanojen valinnan varmistavan esityön jälkeen syntyy varsinaisia ​​kielellisiä tehtäviä, jotka koostuvat kuvausten automaattisen kieliopillisen jäsentämisen tehtävistä kuvantunnistusta varten. Samalla ilmaantuu itsenäinen tutkimusala, joka edellyttää matemaattisen kielitieteen perusteiden tuntemisen lisäksi myös erityisesti kielelliseen kuvankäsittelyyn kehitettyjen tekniikoiden hallintaa.

Kompaktihypoteesi

Jos oletetaan, että oppimisprosessissa piirreavaruus muodostuu suunnitellun luokituksen perusteella, voidaan toivoa, että piirreavaruuden määrittely itsessään asettaa ominaisuuden, jonka vaikutuksesta tässä tilassa olevat kuvat erottuvat helposti. Juuri nämä toiveet muodontunnistuksen alan työn kehittyessä stimuloivat kompaktisuushypoteesin ilmaantumista, jonka mukaan piirreavaruudessa olevat kompaktit joukot vastaavat kuvioita. Kompaktilla joukolla tarkoitamme toistaiseksi joitain kuva-avaruuden pisteiden "möykkyjä" olettaen, että näiden ryhmien välillä on harvinaisuuksia, jotka erottavat ne.

Tätä hypoteesia ei kuitenkaan aina voitu vahvistaa kokeellisesti, mutta mikä tärkeintä, ne tehtävät, joissa kompaktisuushypoteesi toimi hyvin (kuva 2a), poikkeuksetta löytyivät kaikki yksinkertaisen ratkaisun. Ja päinvastoin, niitä tehtäviä, joiden hypoteesia ei vahvistettu (kuva 2b), ei joko ratkaistu ollenkaan tai ne ratkaistiin erittäin vaikeasti lisätemppujen avulla. Tämä tosiasia sai meidät ainakin epäilemään kompaktisuushypoteesin paikkansapitävyyttä, sillä yksikin sen kieltävä esimerkki riittää kumoamaan minkä tahansa hypoteesin. Samanaikaisesti hypoteesin toteutuminen aina, kun oli mahdollista ratkaista hahmontunnistuksen koulutuksen ongelma, piti mielenkiintoa tätä hypoteesia kohtaan. Itse kompaktisuushypoteesi on muuttunut merkiksi tunnistusongelmien tyydyttävän ratkaisun mahdollisuudesta.

Kompaktiteettihypoteesin muotoilu tuo meidät lähelle abstraktin kuvan käsitettä. Jos avaruuden koordinaatit valitaan satunnaisesti, siinä olevat kuvat jaetaan satunnaisesti. Ne ovat tiheämpiä joissakin tilan osissa kuin toisissa. Kutsukaamme jotakin satunnaisesti valittua tilaa abstraktiksi kuvaksi. Tässä abstraktissa tilassa on lähes varmasti kompakteja pistejoukkoja. Siksi kompaktiuden hypoteesin mukaisesti objektijoukkoa, joka vastaa kompakteja pistejoukkoja abstraktissa tilassa, voidaan perustellusti kutsua tietyn tilan abstrakteiksi kuviksi.

Koulutus ja itseopiskelu. Sopeutuminen ja oppiminen

Kaikki kuvassa näkyvät kuvat. 1 kuvaa oppimistehtävää. Jokaisessa näistä ongelmista annetaan useita esimerkkejä (harjoitusjakso) oikein ratkaistuista ongelmista. Jos olisi mahdollista havaita tietty universaali ominaisuus, joka ei riipu kuvien luonteesta tai niiden kuvista, vaan määrittää vain niiden erotettavuuden, niin tavanomaisen tehtävän ohella oppia tunnistamaan käyttämällä tietoa kuulumisesta jokaisesta harjoitusjaksosta yhteen tai toiseen kuvaan muodostuvaan esineeseen voitaisiin asettaa erilainen luokitteluongelma - ns. ilman opettajaa oppimisen ongelma. Tämän tyyppinen tehtävä kuvailevalla tasolla voidaan muotoilla seuraavasti: esineet esitetään järjestelmään samanaikaisesti tai peräkkäin ilman, että ne viittaavat kuviin. Järjestelmän syöttölaite kartoittaa objektijoukon kuvajoukoksi ja käyttää jotain siihen etukäteen upotettua kuvan erotettavuuden ominaisuutta, tekee näistä kohteista itsenäisen luokituksen. Tällaisen itseoppimisprosessin jälkeen järjestelmän tulisi hankkia kyky tunnistaa jo tuttujen esineiden (harjoitusjakson esineiden) lisäksi myös sellaisia, joita ei ole esitelty aiemmin. Tietyn järjestelmän itseoppimisprosessi on sellainen prosessi, jonka seurauksena tämä järjestelmä ilman opettajan apua saa kyvyn kehittää samoja reaktioita saman kuvan esineiden kuviin ja erilaisia ​​reaktioita kuvia eri kuvista. Opettajan rooli tässä tapauksessa koostuu vain jonkin objektiivisen ominaisuuden järjestelmän käynnistämisestä, joka on sama kaikille kuville ja määrittää kyvyn jakaa esinejoukko kuviksi.

Osoittautuu, että tällainen objektiivinen ominaisuus on kuvien kompaktisuuden ominaisuus. Pisteiden keskinäinen järjestely valitussa tilassa sisältää jo tietoa siitä, kuinka pistejoukko tulisi jakaa. Tämä tieto määrää kuvion erotettavuuden ominaisuuden, joka on riittävä kuviontunnistusjärjestelmän itseoppimiseen.

Useimmat tunnetuista itseoppivista algoritmeista pystyvät poimimaan vain abstrakteja kuvia eli kompakteja joukkoja tietyissä tiloissa. Niiden välinen ero näyttää olevan kompaktiuden käsitteen formalisoinnissa. Tämä ei kuitenkaan vähennä, ja joskus jopa lisää itseoppivien algoritmien arvoa, koska usein itse kuvat eivät ole kenenkään ennalta määräämiä, ja tehtävänä on määrittää, mitkä tietyn tilan kuvien osajoukot ovat kuvia. Hyvä esimerkki tällaisesta tehtävän asettamisesta on sosiologinen tutkimus, jossa ihmisryhmät erotetaan joukolla kysymyksiä. Tässä ongelman ymmärtämisessä itseoppivat algoritmit tuottavat aiemmin tuntematonta tietoa tietyssä tilassa olevien kuvien olemassaolosta, joista kenelläkään ei ollut aavistustakaan aiemmin.

Lisäksi itseoppimisen tulos luonnehtii valitun tilan soveltuvuutta tiettyyn tunnistusoppimistehtävään. Jos itseoppimisprosessissa tunnistetut abstraktit kuvat vastaavat todellisia, niin tila on hyvin valittu. Mitä enemmän abstraktit kuvat eroavat todellisista, sitä "epämukavampi" valittu tila on tietylle tehtävälle.

Oppimista kutsutaan yleensä prosessiksi, jossa jossain järjestelmässä kehitetään tietty reaktio ulkoisten identtisten signaalien ryhmiin vaikuttamalla toistuvasti ulkoiseen korjausjärjestelmään. Tällaista ulkoista sopeutumista harjoituksessa kutsutaan yleensä "kannustamiseksi" ja "rangaistukseksi". Tämän säädön luomismekanismi määrittää melkein kokonaan oppimisalgoritmin. Itseoppiminen eroaa oppimisesta siinä, että tässä ei raportoida lisätietoa reaktion oikeellisuudesta järjestelmään.

Sopeutuminen on prosessi, jossa muutetaan järjestelmän parametreja ja rakennetta sekä mahdollisesti ohjataan ajankohtaisiin tietoihin perustuvia toimenpiteitä järjestelmän tietyn tilan saavuttamiseksi alkuepävarmuudella ja muuttuvilla käyttöolosuhteilla.

Oppiminen on prosessi, jonka tuloksena järjestelmä hankkii vähitellen kyvyn reagoida tarvittavilla reaktioilla tiettyihin ulkoisten vaikutusten joukkoon, ja sopeutuminen on järjestelmän parametrien ja rakenteen säätämistä vaaditun laadun saavuttamiseksi. ohjaus ulkoisten olosuhteiden jatkuvien muutosten olosuhteissa.

Ja merkkejä. Tällaisia ​​tehtäviä ratkaistaan ​​melko usein, esimerkiksi ylitettäessä tai ajettaessa katua liikennevaloissa. Kun tunnistat palavan liikennevalon värin ja tuntevat liikennesäännöt, voit tehdä oikean päätöksen siitä, ylittääkö kadun tällä hetkellä vai ei.

Biologisen evoluution prosessissa monet eläimet ratkaisivat ongelmia visuaalisten ja kuulolaitteiden avulla. hahmontunnistus tarpeeksi hyvä. Keinotekoisten järjestelmien luominen hahmontunnistus edelleen vaikea teoreettinen ja tekninen ongelma. Tällaisen tunnustamisen tarve syntyy useilla aloilla - sotilasasioista ja turvallisuusjärjestelmistä kaikenlaisten analogisten signaalien digitalisointiin.

Perinteisesti kuvantunnistustehtävät kuuluvat tekoälytehtävien piiriin.

Ohjeet kuviontunnistukseen

On olemassa kaksi pääsuuntaa:

  • Elävien olentojen tunnistamiskykyjen tutkiminen, niiden selittäminen ja mallintaminen;
  • Teorian ja menetelmien kehittäminen yksittäisten sovellusten ongelmien ratkaisemiseen tarkoitettujen laitteiden rakentamiseksi.

Virallinen ilmaus ongelmasta

Kuviontunnistus on alkutietojen osoittamista tiettyyn luokkaan korostamalla näitä tietoja luonnehtivia olennaisia ​​piirteitä ei-olennaisten tietojen kokonaismassasta.

Tunnistusongelmia asettaessaan he pyrkivät käyttämään matemaattista kieltä yrittäen toisin kuin keinotekoisten hermoverkkojen teoriassa, jossa lähtökohtana on saada tulos kokeella, korvata kokeen loogisella päättelyllä ja matemaattisilla todisteilla.

Useimmiten hahmontunnistusongelmissa tarkastellaan yksivärisiä kuvia, mikä mahdollistaa kuvan tarkastelun funktiona tasossa. Jos tarkastellaan tasoon asetettua pistettä T, jossa toiminto x(x,y) ilmaisee jokaisessa kuvan kohdassa sen ominaispiirteen - kirkkauden, läpinäkyvyyden, optisen tiheyden, silloin tällainen toiminto on kuvan muodollinen tallenne.

Kaikki mahdolliset toiminnot x(x,y) pinnalla T- kaikista kuvista on malli X. Konseptin esittely yhtäläisyyksiä kuvien välillä voit asettaa tunnistustehtävän. Tällaisen asetelman erityinen muoto riippuu voimakkaasti myöhemmistä tunnistusvaiheista yhden tai toisen lähestymistavan mukaisesti.

Kuviontunnistusmenetelmät

Optisessa kuvantunnistuksessa voit käyttää iterointimenetelmää kohteen ulkoasun yli eri kulmissa, mittakaavassa, siirtymäkohdissa jne. Kirjaimia varten sinun on iteroitava fontin, fontin ominaisuuksien jne. yli.

Toinen lähestymistapa on löytää kohteen ääriviivat ja tutkia sen ominaisuuksia (liitettävyys, kulmien läsnäolo jne.)

Toinen lähestymistapa on käyttää keinotekoisia hermoverkkoja. Tämä menetelmä vaatii joko suuren määrän esimerkkejä tunnistustehtävästä (oikeilla vastauksilla) tai erityisen hermoverkkorakenteen, joka ottaa huomioon tämän tehtävän erityispiirteet.

Perceptron hahmontunnistusmenetelmänä

F. Rosenblatt esittelee käsitteen aivomalli, jonka tehtävänä on näyttää kuinka psykologisia ilmiöitä voi syntyä jossain fysikaalisessa järjestelmässä, jonka rakenne ja toiminnalliset ominaisuudet tunnetaan - kuvasi yksinkertaisin syrjintäkokeita. Nämä kokeet liittyvät täysin hahmontunnistusmenetelmiin, mutta eroavat toisistaan ​​siinä, että ratkaisualgoritmi ei ole deterministinen.

Yksinkertaisin kokeilu, jonka perusteella on mahdollista saada psykologisesti merkittävää tietoa tietystä järjestelmästä, kiteytyy siihen, että malli esitetään kahdella eri ärsykkeellä ja siihen vaaditaan reagoimaan eri tavoin. Tällaisen kokeen tarkoituksena voi olla tutkia mahdollisuutta, että järjestelmä joutuu spontaaniin syrjintään ilman kokeen tekijän väliintuloa, tai päinvastoin, tutkia pakkosyrjintää, jossa kokeen tekijä yrittää opettaa järjestelmän suorittamaan vaadittava luokitus.

Oppimiskokeessa perceptronille esitetään yleensä tietty kuvasarja, joka sisältää kunkin erotettavan luokan edustajat. Erään muistin muokkaussäännön mukaan reaktion oikea valinta vahvistuu. Sitten ohjausärsyke esitetään perceptronille ja määritetään oikean vasteen saamisen todennäköisyys tämän luokan ärsykkeille. Riippuen siitä, sopiiko valittu ohjausärsyke yhteen harjoitusjaksossa käytetyn kuvan kanssa vai ei, saadaan erilaisia ​​tuloksia:

  • 1. Jos kontrolliärsyke ei ole sama kuin minkään oppimisärskkeen kanssa, kokeilu ei liity pelkästään puhdasta syrjintää, mutta sisältää myös elementtejä yleistyksiä.
  • 2. Jos kontrolliärsyke herättää tietyn joukon aistielementtejä, jotka ovat täysin erilaisia ​​kuin ne elementit, jotka aktivoituivat aiemmin esitettyjen saman luokan ärsykkeiden vaikutuksesta, niin koe on tutkimus puhdasta yleistystä .

Perceptroneilla ei ole kykyä puhtaaseen yleistämiseen, mutta ne toimivat varsin tyydyttävästi erottelukokeissa, varsinkin jos kontrolliärsyke sopii riittävän tarkasti yhteen niistä kuvioista, joista perceptronilla on jo kokemusta.

Esimerkkejä hahmontunnistusongelmista

  • Kirjeen tunnistaminen.
  • Viivakoodin tunnistus.
  • Rekisterikilven tunnistus.
  • Kasvojen tunnistus.
  • Puheentunnistus.
  • Kuvantunnistus.
  • Maankuoren paikallisten alueiden tunnistaminen, joissa mineraaliesiintymät sijaitsevat.

Kuvioiden tunnistusohjelmat

Katso myös

Huomautuksia

Linkit

  • Juri Lifshits. Kurssi "Teoreettisen informatiikan nykyaikaiset ongelmat" - luentoja tilastollisista muodontunnistuksen, kasvojentunnistuksen, tekstin luokittelun menetelmistä
  • Journal of Pattern Recognition Research (Journal of Pattern Recognition Research)

Kirjallisuus

  • David A. Forsyth, Jean Pons Konenäkö. Moderni lähestymistapa = Computer Vision: A Modern Approach. - M.: "Williams", 2004. - S. 928. - ISBN 0-13-085198-1
  • George Stockman, Linda Shapiro Tietokonenäkö = Computer Vision. - M.: Binom. Knowledge Laboratory, 2006. - S. 752. - ISBN 5947743841
  • A.L. Gorelik, V.A. Skripkin, Tunnistusmenetelmät, M .: Korkeakoulu, 1989.
  • Sh.-K. Cheng, Visuaalisten tietojärjestelmien suunnitteluperiaatteet, M.: Mir, 1994.

Wikimedia Foundation. 2010 .

Tekniikassa tieteellinen ja tekninen suunta, joka liittyy menetelmien kehittämiseen ja järjestelmien rakentamiseen (myös tietokoneen pohjalta) kohteen (kohteen, prosessin, ilmiön, tilanteen, signaalin) kuuluvuuden toteamiseksi johonkin ennen ... ... Suuri tietosanakirja

Yksi uusista alueista kybernetiikka. Sisältö teorian R. noin. on useisiin luokkiin kuuluvien objektien (kuvien) ominaisuuksien ekstrapolointi objekteihin, jotka ovat jossain mielessä lähellä niitä. Yleensä opetettaessa automaattia R. noin. on ... ... Geologinen tietosanakirja

Englanti tunnustaminen, kuva; Saksan kieli Gestalt alterkennung. Matemaattisen kybernetiikan ala, joka kehittää periaatteita ja menetelmiä objektien luokitteluun ja tunnistamiseen, joita kuvaavat rajalliset ominaisuudet, jotka kuvaavat niitä. Antinazi. Tietosanakirja ...... Sosiologian tietosanakirja

Hahmontunnistus- menetelmä monimutkaisten esineiden tutkimiseksi tietokoneen avulla; koostuu ominaisuuksien valinnasta ja algoritmien ja ohjelmien kehittämisestä, joiden avulla tietokoneet voivat luokitella objektit automaattisesti näiden ominaisuuksien mukaan. Esimerkiksi sen määrittämiseksi, mikä ...... Talous- ja matemaattinen sanakirja

- (tekninen), tieteellinen ja tekninen suunta, joka liittyy menetelmien kehittämiseen ja järjestelmien rakentamiseen (mukaan lukien tietokonepohjaiset) kohteen (kohteen, prosessin, ilmiön, tilanteen, signaalin) kuulumisen toteamiseksi johonkin ennen ... ... tietosanakirja

HAHMONTUNNISTUS- matemaattisen kybernetiikan osa, joka kehittää menetelmiä kaikkien niiden kohteiden, ilmiöiden, prosessien, signaalien, tilanteiden luokitteluun ja tunnistamiseen, jotka voidaan kuvata rajallisella joukolla tiettyjä ominaisuuksia tai ominaisuuksia, ... ... Venäjän sosiologinen tietosanakirja

hahmontunnistus- 160 kuvion tunnistus: Lomakeesitysten ja konfiguraatioiden tunnistaminen automaattisilla keinoilla

Kuva ymmärretään strukturoituna kuvausta tutkittavasta kohteesta tai ilmiöstä, jota edustaa piirrevektori, jonka jokainen elementti edustaa jonkin vastaavaa kohdetta kuvaavan ominaisuuden numeerista arvoa.

Tunnistusjärjestelmän yleinen rakenne on seuraava:

Tunnistusongelman tarkoitus on selvittää, onko tutkituilla objekteilla kiinteä äärellinen joukko ominaisuuksia, jotka mahdollistavat niiden liittämisen tiettyyn luokkaan. Tunnistustehtävillä on seuraavat ominaispiirteet:

1. Nämä ovat tiedotustehtäviä, jotka koostuvat kahdesta vaiheesta:

a. Tuo lähdetiedot muotoon, joka on helppo tunnistaa.

b. Tunnistus itsessään on osoitus esineen kuulumisesta tiettyyn luokkaan.

2. Näissä tehtävissä voidaan ottaa käyttöön käsite olioiden analogiasta tai samankaltaisuudesta ja muotoilla käsite objektien läheisyydestä, jonka perusteella objektit luokitellaan samaan luokkaan tai eri luokkiin.

3. Näissä tehtävissä on mahdollista toimia joukolla ennakkotapauksia - esimerkkejä, joiden luokittelu on tiedossa ja jotka formalisoitujen kuvausten muodossa voidaan esittää tunnistusalgoritmille sopeutuakseen tehtävään oppimisprosessissa.

4. Näihin ongelmiin on vaikea rakentaa muodollisia teorioita ja soveltaa klassisia matemaattisia menetelmiä: usein tarkan matemaattisen mallin tieto tai mallin ja matemaattisten menetelmien käytöstä saatava hyöty on kohtuuton kustannuksiin.

5. Näissä tehtävissä on mahdollista "huonoa tietoa" - tietoa, jossa on aukkoja, heterogeenista, epäsuoraa, sumeaa, moniselitteistä, todennäköisyyttä.

On suositeltavaa erottaa seuraavat tunnistustehtävät:

1. Tunnistustehtävä eli esitettävän objektin antaminen sen kuvauksen mukaan jollekin annetuista luokista (koulutus opettajan kanssa).

2. Automaattisen luokituksen tehtävänä on jakaa objektien (tilanteiden) joukko kuvausten mukaan ei-päällekkäisten luokkien järjestelmään (taksonomia, klusterianalyysi, ohjaamaton oppiminen).

3. Informatiivisen ominaisuuksien valinnan ongelma tunnistamisessa.

4. Ongelma alkutietojen pelkistämisestä tunnistamista varten sopivaan muotoon.

5. Dynaaminen tunnistus ja dynaaminen luokittelu - tehtävät 1 ja 2 dynaamisille objekteille.

6. Ennustetehtävä - tehtävät 5, joissa ratkaisun tulee viitata johonkin tulevaisuuden hetkeen.

Kuvan käsite.

Kuva, luokka on luokitusryhmä järjestelmässä, joka yhdistää (erottaa) tietyn objektiryhmän jonkin attribuutin mukaan. Kuvilla on useita tunnusomaisia ​​ominaisuuksia, jotka ilmenevät siinä, että tutustuminen rajalliseen määrään ilmiöitä samasta sarjasta mahdollistaa mielivaltaisen suuren joukon sen edustajia tunnistamisen.


Kuvana voidaan tarkastella myös tiettyä ohjausobjektin tilajoukkoa, ja tälle koko tilajoukolle on ominaista se, että tietyn tavoitteen saavuttamiseksi tarvitaan sama vaikutus kohteeseen. Kuvilla on ominaisia ​​objektiivisia ominaisuuksia siinä mielessä, että erilaisesta havaintomateriaalista oppivat ihmiset luokittelevat suurimmaksi osaksi samat kohteet samalla tavalla ja toisistaan ​​riippumatta.

Yleisesti ottaen kuviontunnistuksen ongelma koostuu kahdesta osasta: koulutuksesta ja tunnistamisesta.

Koulutus toteutetaan näyttämällä yksittäisiä esineitä osoituksena niiden kuulumisesta yhteen tai toiseen kuvaan. Harjoittelun tuloksena tunnistusjärjestelmän tulee hankkia kyky reagoida samoilla reaktioilla kaikkiin saman kuvan esineisiin ja eri reaktioihin kaikkiin eri kuvien esineisiin.

On erittäin tärkeää, että oppimisprosessi päättyy vain rajallisen määrän kohteiden näyttämiseen ilman muita kehotteita. Oppimisen kohteita voivat olla joko visuaalisia kuvia tai erilaisia ​​ulkomaailman ilmiöitä ja muita.

Koulutusta seuraa uusien kohteiden tunnistusprosessi, joka luonnehtii jo koulutetun järjestelmän toimintaa. Näiden toimenpiteiden automatisointi on hahmontunnistuksen koulutuksen ongelma. Siinä tapauksessa, että henkilö itse arvaa tai keksii ja sitten asettaa tietokoneelle luokittelusäännöt, tunnistusongelma ratkeaa osittain, koska henkilö ottaa pää- ja pääosan ongelmasta (koulutuksesta).

Kuviontunnistuksen koulutuksen ongelma on mielenkiintoinen sekä soveltavalta että perustavanlaatuisesta näkökulmasta. Sovelletusta näkökulmasta tämän ongelman ratkaiseminen on tärkeä ennen kaikkea siksi, että se avaa mahdollisuuden automatisoida monia prosesseja, jotka tähän asti ovat liittyneet vain elävien aivojen toimintaan. Ongelman perustavanlaatuinen merkitys liittyy kysymykseen siitä, mitä tietokone voi periaatteessa tehdä ja mitä ei.

Kun ratkaistaan ​​kuviontunnistuksen hallintamenetelmien ongelmia, käytetään termiä "tila" termin "image" sijaan. Tila - tietyt muodot mitattujen virran (hetkellisten) ominaisuuksien näyttämiseksi havaitusta kohteesta, tilajoukko määrittää tilanteen.

Tilannetta kutsutaan yleensä tietyksi monimutkaisen objektin tilojen joukkoksi, joille jokaiselle on tunnusomaista kohteen samat tai samankaltaiset ominaisuudet. Esimerkiksi, jos tiettyä ohjausobjektia pidetään havainnointikohteena, niin tilanne yhdistää tämän kohteen sellaiset tilat, joissa tulee käyttää samoja ohjaustoimenpiteitä. Jos tarkkailun kohteena on peli, niin tilanne yhdistää kaikki pelin tilat.

Esineiden alkuperäisen kuvauksen valinta on yksi oppimismallintunnistuksen ongelman keskeisistä tehtävistä. Alkukuvauksen (ominaisuustilan) onnistuneella valinnalla tunnistustehtävä voi osoittautua triviaaliksi. Sitä vastoin epäonnistuneesti valittu alkukuvaus voi johtaa joko erittäin vaikeaan tiedon jatkokäsittelyyn tai ratkaisun puuttumiseen.

Geometriset ja rakenteelliset lähestymistavat.

Mikä tahansa kuva, joka syntyy oppimis- tai tenttiprosessin kohteen havainnoinnin seurauksena, voidaan esittää vektorina ja siten pisteenä jossain piirreavaruudessa.

Jos väitetään, että kuvia esitettäessä on mahdollista yksiselitteisesti liittää ne yhteen kahdesta (tai useammasta) kuvasta, silloin väitetään, että jossain tilassa on kaksi tai useampia alueita, joilla ei ole yhteisiä pisteitä ja että pisteen kuva on näiltä alueilta. Jokaiselle tällaisen alueen pisteelle voidaan antaa nimi, eli antaa kuvaa vastaava nimi.

Tulkikaamme kuviontunnistuksen oppimisprosessia geometrisen kuvan kannalta, rajoittuen toistaiseksi tapaukseen, jossa tunnistetaan vain kaksi kuviota. Ainoa asia, joka tiedetään etukäteen, on, että jossain tilassa on erotettava kaksi aluetta ja että vain pisteet näistä alueista näytetään. Nämä alueet itsessään eivät ole ennalta määrättyjä, eli niissä ei ole tietoa niiden rajojen sijainnista tai säännöistä sen määrittämiseksi, kuuluuko piste tietylle alueelle.

Koulutuksen aikana esitellään näiltä alueilta satunnaisesti valittuja pisteitä ja raportoidaan, mille alueelle esitetyt pisteet kuuluvat. Näistä alueista, eli niiden rajojen sijainnista koulutuksen aikana, ei raportoida.

Oppimisen tavoitteena on joko rakentaa pinta, joka erottaa paitsi oppimisprosessissa näkyvät pisteet, myös kaikki muut näihin alueisiin kuuluvat pisteet, tai rakentaa näitä alueita rajoittavia pintoja siten, että jokainen niistä sisältää vain sama kuva. Toisin sanoen oppimisen tavoitteena on rakentaa kuvavektoreista sellaisia ​​funktioita, jotka olisivat esimerkiksi positiivisia yhden kuvan kaikissa kohdissa ja negatiivisia toisen kuvan kaikissa kohdissa.

Koska alueilla ei ole yhteisiä pisteitä, tällaisia ​​erottavia toimintoja on aina kokonainen joukko, ja oppimisen seurauksena yksi niistä on rakennettava. Jos esitetyt kuvat eivät kuulu kahteen, vaan suurempaan määrään kuvia, niin tehtävänä on rakentaa harjoituksen aikana esitettyjen pisteiden mukaan pinta, joka erottaa kaikki näitä kuvia vastaavat alueet toisistaan.

Tämä ongelma voidaan ratkaista esimerkiksi rakentamalla funktio, joka ottaa saman arvon kunkin alueen pisteiden yli, ja tämän funktion arvon eri alueiden pisteille tulisi olla erilainen.

Saattaa vaikuttaa siltä, ​​että vain tietyn pistemäärän tietäminen alueelta ei riitä erottamaan koko aluetta. Näitä pisteitä sisältäviä alueita voidaan todellakin määrittää lukemattomia määriä, ja riippumatta siitä, kuinka alueen valitseva pinta on rakennettu niistä, on aina mahdollista määrittää toinen alue, joka leikkaa pinnan ja sisältää samalla pisteet näytetään.

Tiedetään kuitenkin, että ongelma funktion approksimoimiseksi sitä koskevista tiedoista rajoitetussa pistejoukossa on paljon kapeampi kuin koko joukko, jolle funktio on annettu, ja se on yleinen matemaattinen ongelma funktioiden approksimoinnissa. Tietenkin tällaisten ongelmien ratkaiseminen edellyttää tiettyjen rajoitusten käyttöönottoa tarkasteltavana olevan toimintoluokan osalta, ja näiden rajoitusten valinta riippuu niiden tietojen luonteesta, joita opettaja voi lisätä oppimisprosessiin.

Yksi tällainen vihje on kuvitelma kuvien kompaktisuudesta.

Kuvioiden tunnistamisen oppimisen ongelman geometrisen tulkinnan rinnalla on toinenkin lähestymistapa, jota kutsutaan rakenteelliseksi tai kielelliseksi. Tarkastellaanpa kielellistä lähestymistapaa visuaalisen kuvantunnistuksen esimerkillä.

Ensin erotetaan joukko alkukäsitteitä - kuvasta löytyvät tyypilliset fragmentit ja fragmenttien suhteellisen sijainnin ominaisuudet (vasen, alaosa, sisäpuoli jne.). Nämä alkukäsitteet muodostavat sanaston, jonka avulla voit rakentaa erilaisia ​​loogisia lauseita, joita joskus kutsutaan lauseiksi.

Tehtävänä on valita suuresta määrästä väitteitä, jotka voitaisiin rakentaa näiden käsitteiden avulla, jotka ovat tässä tapauksessa merkittävimmät. Lisäksi tarkasteltaessa äärellistä ja, jos mahdollista, pientä määrää esineitä kustakin kuvasta, on tarpeen rakentaa kuvaus näistä kuvista.

Rakennettujen kuvausten tulee olla niin täydellisiä, että ne ratkaisevat kysymyksen, mihin kuvaan annettu esine kuuluu. Kielellistä lähestymistapaa toteutettaessa syntyy kaksi tehtävää: alkusanakirjan eli tyypillisten fragmenttien sarjan rakentaminen ja kuvaussääntöjen rakentaminen tietyn sanakirjan elementeistä.

Kielellisen tulkinnan puitteissa vedetään analogia kuvien rakenteen ja kielen syntaksin välille. Halu tähän analogiaan johtui mahdollisuudesta käyttää matemaattisen kielitieteen laitteistoa, eli menetelmät ovat luonteeltaan syntaktisia. Matemaattisen kielitieteen laitteiston käyttöä kuvien rakenteen kuvaamiseen voidaan soveltaa vasta sen jälkeen, kun kuvien segmentointi osaosiin on tehty, eli on kehitetty sanoja kuvaamaan tyypillisiä fragmentteja ja menetelmiä niiden etsimiseen.

Sanojen valinnan varmistavan esityön jälkeen syntyy varsinaisia ​​kielellisiä tehtäviä, jotka koostuvat kuvausten automaattisen kieliopillisen jäsentämisen tehtävistä kuvantunnistusta varten.

kompaktiuden hypoteesi.

Jos oletetaan, että oppimisprosessissa piirreavaruus muodostuu suunnitellun luokituksen perusteella, voidaan toivoa, että piirreavaruuden määrittely itsessään asettaa ominaisuuden, jonka vaikutuksesta tässä tilassa olevat kuvat erottuvat helposti. Juuri nämä toiveet muodontunnistuksen alan työn kehittyessä stimuloivat kompaktisuushypoteesin ilmaantumista, jonka mukaan piirreavaruudessa olevat kompaktit joukot vastaavat kuvioita.

Kompaktilla joukolla ymmärrämme tiettyjä kuva-avaruuden pisteryppyjä olettaen, että näiden ryhmien välillä on harvinaisuuksia, jotka erottavat ne. Tätä hypoteesia ei kuitenkaan aina ole varmistettu kokeellisesti. Mutta ne ongelmat, joissa kompaktisuushypoteesi toteutui hyvin, löysivät aina yksinkertaisen ratkaisun, ja päinvastoin ne ongelmat, joiden hypoteesia ei vahvistettu, joko ei ratkaistu ollenkaan tai ne ratkaistiin suurella vaivalla ja lisätiedoilla.

Itse kompaktisuushypoteesi on muuttunut merkiksi mahdollisuudesta ratkaista tunnistusongelmia tyydyttävästi.

Kompaktiteettihypoteesin muotoilu tuo meidät lähelle abstraktin kuvan käsitettä. Jos avaruuden koordinaatit valitaan satunnaisesti, siinä olevat kuvat jaetaan satunnaisesti. Ne ovat tiheämpiä joissakin tilan osissa kuin toisissa.

Kutsukaamme jotakin satunnaisesti valittua tilaa abstraktiksi kuvaksi. Tässä abstraktissa tilassa on lähes varmasti kompakteja pistejoukkoja. Siksi kompaktisuushypoteesin mukaisesti objektijoukkoa, jota abstraktissa avaruudessa vastaavat kompaktit pistejoukot, kutsutaan yleensä tietyn tilan abstrakteiksi kuviksi.

Harjoittelu ja itseharjoittelu, sopeutuminen ja harjoittelu.

Jos olisi mahdollista havaita tietty universaali ominaisuus, joka ei riipu kuvien luonteesta tai niiden kuvista, vaan määrittää vain erotettavuuden, niin tavanomaisen tehtävän ohella tunnistuksen opettaminen käyttämällä tietoa kunkin kuulumisesta harjoitusjaksosta toiseen tai toiseen kuvaan, olisi parempi esittää erilainen luokitteluongelma - ns. ilman opettajaa oppimisen ongelma.

Tämän tyyppinen tehtävä kuvailevalla tasolla voidaan muotoilla seuraavasti: esineet esitetään järjestelmään samanaikaisesti tai peräkkäin ilman, että ne viittaavat kuviin. Järjestelmän syöttölaite kartoittaa objektijoukon kuvajoukoksi ja käyttää jotain siihen etukäteen upotettua kuvan erotettavuuden ominaisuutta, tekee näistä kohteista itsenäisen luokituksen.

Tällaisen itseoppimisprosessin jälkeen järjestelmän tulisi hankkia kyky tunnistaa jo tuttujen esineiden (harjoitusjakson esineiden) lisäksi myös sellaisia, joita ei ole esitelty aiemmin. Tietyn järjestelmän itseoppimisprosessi on sellainen prosessi, jonka seurauksena tämä järjestelmä ilman opettajan apua saa kyvyn kehittää samoja reaktioita saman kuvan esineiden kuviin ja erilaisia ​​reaktioita kuvia eri kuvista.

Opettajan rooli tässä tapauksessa koostuu vain jonkin objektiivisen ominaisuuden järjestelmän käynnistämisestä, joka on sama kaikille kuville ja määrittää kyvyn jakaa esinejoukko kuviksi.

Osoittautuu, että tällainen objektiivinen ominaisuus on kuvien kompaktisuuden ominaisuus. Pisteiden keskinäinen järjestely valitussa tilassa sisältää jo tietoa siitä, kuinka pistejoukko tulisi jakaa. Tämä tieto määrää kuvion erotettavuuden ominaisuuden, joka on riittävä kuviontunnistusjärjestelmän itseoppimiseen.

Useimmat tunnetuista itseoppivista algoritmeista pystyvät valitsemaan vain abstrakteja kuvia, eli kompakteja joukkoja tietyissä tiloissa. Niiden välinen ero on tiiviyden käsitteen formalisoinnissa. Tämä ei kuitenkaan vähennä, ja joskus jopa lisää itseoppivien algoritmien arvoa, koska usein itse kuvat eivät ole kenenkään ennalta määräämiä, ja tehtävänä on määrittää, mitkä tietyn tilan kuvien osajoukot ovat kuvia.

Esimerkki tällaisesta ongelman toteamisesta on sosiologinen tutkimus, jossa ihmisryhmiä erotetaan kysymysjoukon perusteella. Tässä ongelman ymmärtämisessä itseoppivat algoritmit tuottavat aiemmin tuntematonta tietoa tietyssä tilassa olevien kuvien olemassaolosta, joista kenelläkään ei ollut aavistustakaan aiemmin.

Lisäksi itseoppimisen tulos luonnehtii valitun tilan soveltuvuutta tiettyyn tunnistusoppimistehtävään. Jos itseoppimisen tilaan allokoidut abstraktit kuvat osuvat todellisiin, niin tila on valittu onnistuneesti. Mitä abstraktimmat kuvat eroavat todellisista, sitä epämukavampi on valittu tila tietylle tehtävälle.

Oppimista kutsutaan yleensä prosessiksi, jossa jossain järjestelmässä kehitetään tietty reaktio ulkoisten identtisten signaalien ryhmiin vaikuttamalla toistuvasti ulkoiseen korjausjärjestelmään. Tämän säädön luomismekanismi määrittää melkein kokonaan oppimisalgoritmin.

Itseoppiminen eroaa oppimisesta siinä, että tässä ei raportoida lisätietoa reaktion oikeellisuudesta järjestelmään.

Sopeutuminen on prosessi, jossa järjestelmän parametreja ja rakennetta sekä mahdollisesti ohjaustoimenpiteitä muutetaan nykyiseen tietoon perustuen järjestelmän tietyn tilan saavuttamiseksi alkuepävarmuudella ja muuttuvilla käyttöolosuhteilla.

Oppiminen on prosessi, jonka tuloksena järjestelmä hankkii vähitellen kyvyn reagoida tarvittavilla reaktioilla tiettyihin ulkoisten vaikutusten joukkoon, ja sopeutuminen on järjestelmän parametrien ja rakenteen säätämistä vaaditun laadun saavuttamiseksi. ohjaus ulkoisten olosuhteiden jatkuvien muutosten olosuhteissa.


Puheentunnistusjärjestelmät.

Puhe toimii pääasiallisena ihmisten välisen viestinnän välineenä ja siksi puheviestintää pidetään yhtenä tekoälyjärjestelmän tärkeimmistä komponenteista. Puheentunnistus on prosessi, jossa mikrofonin tai puhelimen lähdössä tuotettu akustinen signaali muunnetaan sanasarjaksi.

Vaikeampi tehtävä on puheen ymmärtäminen, joka liittyy akustisen signaalin merkityksen tunnistamiseen. Tässä tapauksessa puheentunnistuksen alijärjestelmän lähtö toimii lausunnon ymmärtämisen alijärjestelmän tulona. Automaattinen puheentunnistus (APP-järjestelmät) on yksi luonnollisen kielenkäsittelyteknologioiden alueista.

Automaattista puheentunnistusta käytetään tekstien syöttämisen automatisoimiseen tietokoneisiin, suullisten kyselyjen muodostamiseen tietokantoihin tai tiedonhakujärjestelmiin, suullisten komentojen muodostamiseen erilaisiin älylaitteisiin.

Puheentunnistusjärjestelmien peruskäsitteet.

Puheentunnistusjärjestelmille on tunnusomaista monet parametrit.

Yksi tärkeimmistä parametreista on sanantunnistusvirhe (ORF). Tämä parametri on tunnistamattomien sanojen lukumäärän suhde puhuttujen sanojen kokonaismäärään.

Muita automaattisia puheentunnistusjärjestelmiä kuvaavia parametreja ovat:

1) sanakirjan koko,

2) puhetila,

3) puhetyyli,

4) aihealue,

5) puhujariippuvuus,

6) akustisen melun taso,

7) tulokanavan laatu.

Sanakirjan koosta riippuen APP-järjestelmät on jaettu kolmeen ryhmään:

Pienellä sanakirjakoolla (jopa 100 sanaa),

Keskimääräisellä sanakirjakoolla (100 sanasta useisiin tuhansiin sanoihin)

Suurella sanakirjalla (yli 10 000 sanaa).

Puhetila kuvaa tapaa, jolla sanat ja lauseet lausutaan. On olemassa järjestelmiä jatkuvan puheen tunnistamiseen ja järjestelmiä, jotka mahdollistavat vain yksittäisten puhesanojen tunnistamisen. Eristetty sanantunnistustila edellyttää, että puhuja pitää lyhyen tauon sanojen välillä.

Puhetyylin mukaan APP-järjestelmät jaetaan kahteen ryhmään: deterministisiin puhejärjestelmiin ja spontaaneihin puhejärjestelmiin.

Deterministisissa puheentunnistusjärjestelmissä puhuja toistaa puhetta noudattaen kielen kielioppisääntöjä. Spontaanille puheelle on ominaista kieliopin sääntöjen rikkominen, ja se on vaikeampi tunnistaa.

Aihealueesta riippuen löytyy APP-järjestelmiä, jotka keskittyvät sovelluksiin pitkälle erikoistuneilla aloilla (esim. pääsy tietokantoihin) ja APP-järjestelmiä, joiden laajuus on rajoittamaton. Jälkimmäiset vaativat suuren määrän sanavarastoa, ja niiden pitäisi mahdollistaa spontaanin puheen tunnistaminen.

Monet automaattiset puheentunnistusjärjestelmät ovat puhujariippuvaisia. Tämä edellyttää järjestelmän esisäätöä tietyn puhujan ääntämisen ominaisuuksien mukaan.

Puheentunnistusongelman ratkaisun monimutkaisuus selittyy akustisten signaalien suurella vaihtelulla. Tämä vaihtelu johtuu useista syistä:

Ensinnäkin foneemien erilainen toteutus - kielen äänijärjestelmän perusyksiköt. Foneemien toteutuksen vaihtelu johtuu puhevirran viereisten äänten vaikutuksesta. Foneemien toteutumisen sävyjä ääniympäristöstä johtuen kutsutaan allofoneiksi.

Toiseksi akustisten vastaanottimien sijainti ja ominaisuudet.

Kolmanneksi saman puhujan puheen parametrien muutokset, jotka johtuvat puhujan erilaisesta tunnetilasta, puheen tahdista.

Kuvassa näkyvät puheentunnistusjärjestelmän pääkomponentit:

Digitalisoitu puhesignaali saapuu esikäsittely-yksikköön, jossa poimitaan äänentunnistukseen tarvittavat ominaisuudet. Äänentunnistus tehdään usein keinotekoisilla hermoverkkomalleilla. Valittuja ääniyksiköitä käytetään tämän jälkeen etsimään sanasarja, joka vastaa parhaiten syötettyä puhesignaalia.

Sanajonon haku suoritetaan akustisten, leksikaalisten ja kielimallien avulla. Mallin parametrit määritetään koulutustiedoista vastaavien oppimisalgoritmien perusteella.

Puheen synteesi tekstin perusteella. Peruskonseptit

Monissa tapauksissa tekoälyjärjestelmien luominen hänen viestinnän elementeillä edellyttää viestien tulostamista puhemuodossa. Kuvassa on lohkokaavio älykkäästä kysymys-vastausjärjestelmästä, jossa on puheliittymä:

Kuva 1.

Ota pala luentoja Olegilta

Harkitse empiirisen lähestymistavan piirteitä puheenosien tunnistamisen esimerkissä. Tehtävänä on antaa nimikkeet lauseen sanoille: substantiivi, verbi, prepositio, adjektiivi ja vastaava. Lisäksi on tarpeen määritellä joitain substantiivien ja verbien lisäominaisuuksia. Esimerkiksi substantiiville se on numero, ja verbille se on muoto. Virallistamme tehtävän.

Esitetään lause sanajonona: W=w1 w2…wn, missä wn ovat satunnaismuuttujia, joista jokainen saa yhden mahdollisista kielisanakirjaan kuuluvista arvoista. Lauseen sanoille osoitettu tunnistesarja voidaan esittää sekvenssillä X=x1 x2 … xn, jossa xn ovat satunnaismuuttujia, joiden arvot on määritelty mahdollisten otsikoiden joukkoon.

Tällöin puheosan tunnistuksen ongelmana on löytää todennäköisin merkkijono x1, x2, …, xn sanojen w1, w2, …, wn perusteella. Toisin sanoen on tarpeen löytää sellainen merkkijono X*=x1 x2 … xn, joka tarjoaa suurimman ehdollisen todennäköisyyden P(x1, x2, …, xn| w1 w2.. wn).

Kirjoitetaan ehdollinen todennäköisyys P(X| W) muotoon P(X| W)=P(X,W) / P(W). Koska muuttujalle X on löydettävä suurin ehdollinen todennäköisyys P(X,W), saadaan X*=arg x max P(X,W). Yhteinen todennäköisyys P(X,W) voidaan kirjoittaa ehdollisten todennäköisyyksien tulona: P(X,W)=tulo u-1:stä n:ään P(x i |x1,…,x i -1 , w1,…, w i -1 ) P(w i |x1,…,x i -1, w1,…,w i -1). Tämän lausekkeen maksimin suora haku on vaikea tehtävä, koska suurilla n:n arvoilla hakutilasta tulee erittäin suuri. Siksi tähän tuloon kirjoitetut todennäköisyydet on approksimoitu yksinkertaisemmilla ehdollisilla todennäköisyyksillä: P(x i |x i -1) P(w i |w i -1). Tässä tapauksessa oletetaan, että tunnisteen x i arvo liittyy vain edelliseen tunnisteeseen x i -1 eikä se riipu aikaisemmista nimiöistä, ja että sanan w i todennäköisyys määräytyy vain nykyisen tunnisteen x i perusteella. Näitä oletuksia kutsutaan Markovin oletuksiksi ja ongelman ratkaisemiseen käytetään Markovin mallien teoriaa. Markovin oletukset huomioon ottaen voimme kirjoittaa:

X*= arg x1, …, xn max П i =1 n P(x i |x i -1) P(wi|wi-1)

Kun ehdolliset todennäköisyydet arvioidaan harjoitusdatajoukon perusteella

Merkkijonon X* haku suoritetaan Viterbi-dynaamisen ohjelmointialgoritmin avulla. Viterbi-algoritmia voidaan pitää tilagraafin hakualgoritmin muunnelmana, jossa kärjet vastaavat sanatunnisteita.

Tyypillistä on, että mille tahansa nykyiselle kärkipisteelle alitunnisteiden joukko on aina sama. Lisäksi jokaisen lapsipisteen yläpisteiden joukot ovat myös samat. Tämä selittyy sillä, että tilakaavioon tehdään siirtymiä ottaen huomioon kaikki mahdolliset etikettien yhdistelmät. Markovin oletus tarjoaa merkittävän yksinkertaistuksen puheenosien tunnistamisongelmaan säilyttäen samalla korkean tarkkuuden nimikkeiden osoittamisessa sanoille.

Joten 200 tunnisteen avulla tehtävän tarkkuus on noin 97 %. Imperial analyysiä tehtiin pitkään käyttämällä stokastisia yhteydettömiä kielioppeja. Niissä on kuitenkin merkittävä haittapuoli. Se johtuu siitä, että samat todennäköisyydet voidaan määrittää eri jäsennyksiin. Tämä johtuu siitä, että jäsentämisen todennäköisyys esitetään jäsennykseen liittyvien sääntöjen todennäköisyyksien tulona. Jos analyysin aikana käytetään erilaisia ​​sääntöjä, joille on tunnusomaista samat todennäköisyydet, niin tästä syntyy osoitettu ongelma. Parhaan tuloksen antaa kielioppi, joka ottaa huomioon kielen sanaston.

Tässä tapauksessa säännöt sisältävät tarvittavan leksikaalisen tiedon, joka tarjoaa eri todennäköisyysarvot samalle säännölle eri leksikaalisissa ympäristöissä. Imperial jäsennys vastaa paremmin hahmontunnistusta kuin perinteinen jäsennys sen klassisessa merkityksessä.

Vertailevat tutkimukset ovat osoittaneet, että luonnollisen kielen sovellusten imperiaalisen jäsennyksen tarkkuus on suurempi kuin perinteisen jäsentämisen.

Automaattisen hahmontunnistuksen menetelmät ja niiden käyttöönotto optisissa merkintunnistusjärjestelmissä (Optical Character Recognition - OCR-järjestelmät) on yksi edistyneimmistä tekoälytekniikoista. Tämän tekniikan kehittämisessä venäläiset tutkijat ovat johtavassa asemassa maailmassa.

OCR-järjestelmällä tarkoitetaan automaattista kuvantunnistusjärjestelmää, jossa käytetään erikoisohjelmia painetun tai käsin kirjoitetun tekstin (esimerkiksi skannerin kautta tietokoneeseen syötetyn) merkit kuvaamiseen ja sen muuntamiseen tekstinkäsittelyohjelmien, tekstieditorien käsittelyyn soveltuvaan muotoon. , jne.

Lyhenne OCR tulkitaan joskus nimellä Optical Character Reader - laite optiseen merkkien tunnistamiseen tai automaattiseen tekstin lukemiseen. Tällä hetkellä teollisuuskäytössä olevat laitteet käsittelevät jopa 100 000 asiakirjaa päivässä.

Teolliseen käyttöön kuuluu hyvä- tai keskilaatuisten asiakirjojen syöttäminen - tämä on laskentalomakkeiden, veroilmoitusten jne. käsittely.

Listaamme aihealueen ominaisuudet, jotka ovat tärkeitä OCR-järjestelmien kannalta:

  • fontti ja koko erilaisia ​​merkkejä;
  • vääristymät symbolikuvissa (katkoja symbolikuvissa);
  • vääristymät skannauksen aikana;
  • ulkomaiset sulkeumat kuvissa;
  • tekstikatkelmien yhdistelmä eri kielillä;
  • laaja valikoima merkkiluokkia, jotka voidaan tunnistaa vain lisäkontekstitiedoilla.

Painettujen ja käsinkirjoitettujen tekstien automaattinen lukeminen on erikoistapaus monimutkaisten kuvien automaattiselle visuaaliselle havainnolle. Lukuisat tutkimukset ovat osoittaneet, että tämän ongelman ratkaisemiseksi täydellisesti tarvitaan älyllistä tunnustamista, ts. "tunnustamista ymmärtämällä".

Kaikki OCR-järjestelmät perustuvat kolmeen periaatteeseen.

  • 1. Kuvan eheyden periaate. Tutkittavassa objektissa on aina merkittäviä osia, joiden välillä on suhteita. Paikallisten toimintojen tulokset kuvan osilla tulkitaan vain yhdessä tulkintaprosessissa yhtenäisiä fragmentteja ja koko kuvaa kokonaisuutena.
  • 2. Tarkoituksenmukaisuuden periaate. Tunnistus on tarkoituksenmukainen prosessi hypoteesien luomiseksi ja testaamiseksi (selvitetään, mitä esineeltä odotetaan).
  • 3. Sopeutuvuuden periaate. Tunnustusjärjestelmän on kyettävä itseoppimaan.

Johtavat venäläiset OCR-järjestelmät: FineReader; FineReader Manuscript; formReader; CunieForm (kognitiiviset tekniikat), kognitiiviset muodot (kognitiiviset teknologiat) .

FineReader-järjestelmän tuottaa ABBYY, joka on perustettu vuonna 1989. ABBYY kehittyy kahteen suuntaan: konenäköön ja soveltavaan lingvistiikkaan. Tieteellisen tutkimuksen ja kehityksen strateginen suunta on konenäön, tekoälyn ja soveltavan kielitieteen alan teknologioiden luonnollinen kielinäkökohta.

CuneiForm GOLD for Windows on maailman ensimmäinen itseoppiva älykäs OCR-järjestelmä, joka käyttää uusinta mukautuvaa tekstintunnistustekniikkaa ja tukee monia kieliä. Jokaiselle kielelle toimitetaan sanakirja asiayhteyden tarkistamista ja tunnistustulosten laadun parantamista varten. Tunnistaa kaikki tulostimista saadut polygrafiset, kirjoituskoneella kirjoitetut kirjasimet ja fontit, lukuun ottamatta koristeellisia ja käsinkirjoitettuja sekä erittäin huonolaatuisia tekstejä.

Kuviontunnistusjärjestelmien ominaisuudet. OSL-tekniikoiden joukossa erityistekniikat tiettyjen automaattisen hahmontunnistuksen ongelmien ratkaisemiseksi ovat erittäin tärkeitä:

  • etsi ihmisiä valokuvien perusteella;
  • etsiä mineraaliesiintymiä ja sääennusteita ilmakuvien ja satelliittikuvien perusteella eri valosäteilyalueilla;
  • maantieteellisten karttojen kokoaminen edellisessä tehtävässä käytettyjen lähtötietojen perusteella;
  • iiriksen sormenjälkien ja piirustusten analysointi oikeuslääketieteen, turvallisuuden ja lääketieteen järjestelmissä.

Tietojen valmistelu- ja käsittelyvaiheessa, erityisesti yrityksen tietokoneistuksessa, kirjanpidon automatisoinnissa, syntyy tehtävänä syöttää tietokoneeseen suuri määrä teksti- ja graafista tietoa. Tärkeimmät laitteet graafisten tietojen syöttämiseen ovat: skanneri, faksimodeemi ja harvemmin digitaalikamera. Lisäksi optisten tekstintunnistusohjelmien avulla voit syöttää (digitoida) tekstitietoja tietokoneelle. Nykyaikaiset ohjelmisto- ja laitteistojärjestelmät mahdollistavat suurten tietomäärien automaattisen syöttämisen tietokoneeseen esimerkiksi verkkoskannerin ja rinnakkaistekstintunnistuksen avulla usealla tietokoneella samanaikaisesti.

Useimmat OCR-ohjelmat toimivat bittikarttakuvan kanssa, joka vastaanotetaan faksimodeemin, skannerin, digitaalikameran tai muun laitteen kautta. Ensimmäisessä vaiheessa OSA-järjestelmän on jaettava sivu tekstilohkoihin oikean ja vasemman tasauksen ominaisuuksien ja useiden sarakkeiden läsnäolon perusteella. Tunnistettu lohko jaetaan sitten riveihin. Näennäisestä yksinkertaisuudesta huolimatta tämä ei ole niin itsestään selvä tehtävä, koska käytännössä sivukuvan tai sen fragmenttien vääristyminen taitettuna on väistämätöntä. Pienikin vino saa yhden rivin vasemman reunan olemaan alempana kuin seuraavan oikean reunan, varsinkin kun riviväli on pieni. Tämän seurauksena on ongelma sen linjan määrittämisessä, johon tämä tai tuo kuvan fragmentti kuuluu. Esimerkiksi kirjeille

Viivat jaetaan sitten kuvan vierekkäisiksi alueiksi, jotka vastaavat yksittäisiä kirjaimia; tunnistusalgoritmi tekee oletuksia näiden alueiden vastaavuudesta merkkeihin, ja sitten jokainen merkki valitaan, minkä seurauksena sivu palautetaan tekstin merkeissä ja pääsääntöisesti tietyssä muodossa. OCR-järjestelmät voivat saavuttaa parhaan tunnistustarkkuuden – yli 99,9 % tavallisista fonteista koostuville kuville. Ensi silmäyksellä tämä tunnistustarkkuus vaikuttaa täydelliseltä, mutta virheprosentti on silti masentava, sillä jos sivua on noin 1500 merkkiä, niin jopa 99,9 %:n tunnistuksen onnistumisprosentilla on yksi tai kaksi virhettä sivulla. Tällaisissa tapauksissa kannattaa käyttää sanakirjan tarkistusmenetelmää, eli jos sanaa ei ole järjestelmän sanakirjassa, se yrittää löytää samanlaisen erityisten sääntöjen mukaisesti. Mutta tämä ei silti mahdollista 100-prosenttista virheiden korjaamista ja vaatii ihmisten hallinnan tuloksiin.

Tosielämässä kohdatut tekstit ovat yleensä kaukana täydellisistä, ja "epäpuhtaiden" tekstien tunnistusvirheiden prosenttiosuus on usein liian korkea. Likaiset kuvat ovat ilmeisin ongelma, koska pienetkin täplät voivat peittää hahmon määrittävät osat tai muuttaa ne toisiksi. Ongelmana on myös "inhimilliseen tekijään" liittyvä huolimaton skannaus, koska skannerin ääressä istuva käyttäjä ei yksinkertaisesti pysty tasoittamaan jokaista skannattua sivua ja kohdistamaan sitä tarkasti skannerin reunojen kanssa. Jos asiakirja on valokopioitu, siinä on usein taukoja ja merkkien yhdistämistä. Mikä tahansa näistä vaikutuksista voi aiheuttaa järjestelmän virheitä, koska jotkin OSD-järjestelmät olettavat, että kuvan yhtenäisen alueen on oltava yksi merkki. Rajojen ulkopuolella oleva tai vino sivu luo hieman vinoja hahmokuvia, jotka OSA-järjestelmä voi hämmentää.

OSL-järjestelmäohjelmisto toimii yleensä skannerilta saadun suuren bittikartan kanssa. Kuvat, joilla on vakioresoluutio, saadaan skannaamalla 9600 p / d tarkkuudella. A4-arkkikuva tällä resoluutiolla vie noin 1 Mt muistia.

OCR-järjestelmien päätarkoituksena on analysoida rasteritietoa (skannattu merkki) ja määrittää vastaava merkki kuvan fragmentille. Tunnistusprosessin päätyttyä OCR-järjestelmien tulee pystyä säilyttämään lähdeasiakirjojen muotoilu, osoittamaan kappaleattribuutti oikeaan paikkaan, tallentamaan taulukoita, grafiikkaa jne. Nykyaikaiset tunnistusohjelmat tukevat kaikkia tunnettuja teksti- ja grafiikkamuotoja sekä laskentataulukkomuotoja, sekä HTML ja PDF.

OCR-järjestelmien kanssa työskentelyn ei yleensä pitäisi aiheuttaa erityisiä vaikeuksia. Useimmissa näistä järjestelmistä on yksinkertaisin automaattinen "skannaa ja tunnista" -tila (Scan & Read), ja ne tukevat myös kuvien tunnistustilaa tiedostoista. Parhaiden mahdollisten tulosten saavuttamiseksi tietyssä järjestelmässä on kuitenkin toivottavaa (ja usein välttämätöntä) säätää se manuaalisesti tietyntyyppisen tekstin, kirjelomakkeiden asettelun ja paperin laadun mukaan. Rajojen ulkopuolella oleva tai vino sivu luo hieman vääristyneitä merkkikuvia, jotka OCR-järjestelmä voi hämmentää.

OCR-järjestelmän kanssa työskennellessä on erittäin tärkeää valita tunnistuskieli ja tunnistettavan materiaalin tyyppi (kirjoituskone, faksi, matriisitulostin, sanomalehti jne.) sekä käyttöliittymän intuitiivisuus. Tunnistaessa tekstejä, joissa käytetään useita kieliä, tunnistustehokkuus riippuu OCR-järjestelmän kyvystä muodostaa kieliryhmiä. Samaan aikaan joissakin järjestelmissä on jo yhdistelmät yleisimmin käytetyille kielille, kuten venäjälle ja englannille.

Tällä hetkellä on olemassa valtava määrä ohjelmia, jotka tukevat tekstintunnistusta yhtenä mahdollisuutena. FineReader-järjestelmä on johtava tällä alalla. Ohjelman uusimmassa versiossa (6.0) on nyt työkalut uusien FineReader 6.0 -tekniikkaan perustuvien järjestelmien kehittämiseen. FineReader 6.0 -perheeseen kuuluvat: FineReader 6.0 Professional, FineReader 6.0 Corporate Edition, FineReader Scripting Edition 6.0 ja FineReader Engine 6.0. FineReader 6.0 -järjestelmällä on sen lisäksi, että se tuntee valtavan määrän tallennusmuotoja, mukaan lukien PDF, ja se pystyy tunnistamaan suoraan PDF-tiedostoista. Uuden Intelligent Background Filtering -tekniikan (älykäs taustasuodatus) avulla voit suodattaa pois tietoa dokumentin tekstuurista ja kuvan taustamelusta: joskus harmaata tai värillistä taustaa käytetään korostamaan asiakirjan tekstiä. Tämä ei estä henkilöä lukemasta, mutta tavanomaisilla tekstintunnistusalgoritmeilla on vakavia vaikeuksia työskennellä tällaisen taustan päällä olevien kirjainten kanssa. FineReader voi havaita tällaista tekstiä sisältävät vyöhykkeet erottamalla tekstin asiakirjan taustasta, etsimällä tiettyä kokoa pienempiä pisteitä ja poistamalla ne. Samanaikaisesti kirjainten ääriviivat säilyvät, jotta näitä ääriviivoja lähellä olevat taustapisteet eivät aiheuta häiriöitä, jotka voivat heikentää tekstintunnistuksen laatua.

Nykyaikaisten asetteluohjelmien ominaisuuksien avulla suunnittelijat luovat usein monimutkaisen muotoisia objekteja, kuten käärimällä monisarakkeen tekstiä ei-suorakulmaisen kuvan ympärille. FineReader 6.0 tukee tällaisten objektien tunnistamista ja niiden tallentamista MS Word -tiedostoihin. Nyt monimutkaiset asetteluasiakirjat toistetaan tarkasti tässä tekstieditorissa. Jopa taulukot tunnistetaan maksimaalisella tarkkuudella säilyttäen samalla kaikki muokkausmahdollisuudet.

ABBYY FormReader on yksi ABBYYn tunnistusohjelmista, jotka perustuvat ABBYY FineReader Engineen. Tämä ohjelma on suunniteltu tunnistamaan ja käsittelemään lomakkeita, jotka voidaan täyttää manuaalisesti. ABBYY FormReader pystyy käsittelemään lomakkeita, joissa on kiinteä asettelu, sekä lomakkeita, joiden rakenne voi muuttua. Tunnistuksessa käytettiin uutta ABBYY FlexiForm -tekniikkaa.

Johtavat ohjelmistotoimittajat ovat lisensoineet venäläistä tietotekniikkaa käytettäväksi tuotteissaan. Suosituissa ohjelmistopaketeissa Corel Draw (Corel Corporation), FaxLine/OCR & Business Card Wizard (Inzer Corporation) ja monissa muissa on sisäänrakennettu CuneiForm OCR -kirjasto. Tästä ohjelmasta tuli ensimmäinen OCR-järjestelmä Venäjällä, joka sai MS Windows Compatible -logon.

Readiris Pro 7 on ammattimainen tekstintunnistusohjelma. Valmistajien mukaan tämä OCR-järjestelmä eroaa analogeista korkeimmalla tarkkuudella muuntaa tavalliset (jokapäiväiset) painetut asiakirjat, kuten kirjeet, faksit, aikakauslehtiartikkelit, sanomalehtileikkeet, muokattaviksi objekteiksi (mukaan lukien PDF-tiedostot). Ohjelman tärkeimmät edut ovat: kyky tunnistaa enemmän tai vähemmän tarkasti pakatut kuvat, jotka on pakattu "maksimiin" (maksimaalinen laadun heikkeneminen) käyttämällä JPEG-muotomenetelmää, tuki digitaalikameroille ja sivun suunnan automaattinen tunnistus, tuki jopa 92 kieltä (mukaan lukien venäjä).

OmniPage 11 on ScanSoft-tuote. Tämän ohjelman rajoitettu versio (OmniPage 11 Limited Edition, OmniPage Lite) toimitetaan yleensä uusien skannerien mukana (Euroopassa ja Yhdysvalloissa). Kehittäjät väittävät, että heidän ohjelmansa tunnistaa painetut asiakirjat lähes 100% tarkkuudella ja palauttaa niiden muotoilun, mukaan lukien sarakkeet, taulukot, tavutus (mukaan lukien sanaosien tavutus), otsikot, lukujen otsikot, allekirjoitukset, sivunumerot, alaviitteet, kappaleet, numeroidut luettelot , punaiset viivat, kaaviot ja kuvat. On mahdollista tallentaa Microsoft Office-, PDF- ja 20 muuhun muotoon, tunnistaa PDF-tiedostoista ja muokata tässä muodossa. Tekoälyjärjestelmän avulla voit automaattisesti havaita ja korjata virheet ensimmäisen manuaalisen korjauksen jälkeen. Uusi erityisesti kehitetty ohjelmistomoduuli "Dcspeckle" mahdollistaa heikentyneen laadun (faksit, kopiot, kopioiden kopiot jne.) tunnistamisen. Ohjelman etuna on kyky tunnistaa värillistä tekstiä ja äänenkorjaus. OmniPagesta on myös versio Macintosh-tietokoneille.

  • cm: Bashmakov A. I., Bashmakov I. A.Älykäs tietotekniikka.

Lähetä hyvä työsi tietokanta on yksinkertainen. Käytä alla olevaa lomaketta

Opiskelijat, jatko-opiskelijat, nuoret tutkijat, jotka käyttävät tietopohjaa opinnoissaan ja työssään, ovat sinulle erittäin kiitollisia.

Lähetetty http://www.allbest.ru/

Venäjän federaation opetus- ja tiedeministeriö

Novosibirskin valtion talous- ja johtamisyliopisto "NINH"

Tietotekniikan tiedekunta

Sovellettavan tietotekniikan laitos

sumea logiikka ja hermoverkot

Hahmontunnistus

Suunta: Yritysinformatiikka (sähköinen liiketoiminta)

Opiskelijan koko nimi: Ekaterina Vitalievna Mazur

Tarkastaja: Pavlova Anna Illarionovna

Novosibirsk 2016

  • Johdanto
  • 1. Tunnustamisen käsite
    • 1.1 Kehityshistoria
    • 1.2 Kuviontunnistusmenetelmien luokittelu
  • 2. Kuviontunnistusmenetelmät
  • 3. Kuviontunnistusongelmien yleispiirteet ja niiden tyypit
  • 4. Kuviontunnistuksen kehittämisen ongelmat ja näkymät
    • 4.1 Kuviontunnistuksen soveltaminen käytännössä
  • Johtopäätös

Johdanto

Kauan hahmontunnistuksen ongelmaa pohdittiin vain biologisesta näkökulmasta. Samaan aikaan havaintoja tehtiin vain laadullisille ominaisuuksille, jotka eivät mahdollistaneet toimintamekanismin kuvaamista.

N. Wienerin 1900-luvun alussa esittelemä käsite kybernetiikka(tiede koneiden, elävien organismien ja yhteiskunnan tiedon hallinta- ja siirtoprosessien yleisistä laeista), mahdollisti kvantitatiivisten menetelmien käyttöönoton tunnustamisasioissa. Eli esitellä tämä prosessi (itse asiassa - luonnollinen ilmiö) matemaattisilla menetelmillä.

Kuviontunnistuksen teoria on yksi kybernetiikan pääosista sekä teoreettisesti että soveltaen. Siten joidenkin prosessien automatisointiin kuuluu sellaisten laitteiden luominen, jotka pystyvät reagoimaan ulkoisen ympäristön muuttuviin ominaisuuksiin tietyllä määrällä positiivisia reaktioita.

Tämän tason ongelmien ratkaisemisen perustana ovat klassisen tilastollisten ratkaisujen teorian tulokset. Sen puitteissa rakennettiin algoritmeja sen luokan määrittämiseksi, johon tunnistettava kohde voidaan määrittää.

Tämän työn tarkoituksena on tutustua hahmontunnistusteorian käsitteisiin: paljastaa tärkeimmät määritelmät, tutkia esiintymishistoriaa, tuoda esille teorian keskeiset menetelmät ja periaatteet.

Aiheen relevanssi piilee siinä, että hahmontunnistus on tällä hetkellä yksi kybernetiikan johtavista alueista. Joten viime vuosina sitä on käytetty yhä enemmän: se yksinkertaistaa ihmisen vuorovaikutusta tietokoneen kanssa ja luo edellytykset erilaisten tekoälyjärjestelmien käytölle.

kuvantunnistussovellus

1. Tunnustuksen käsite

Tunnustamisen ongelma herätti pitkään vain sovelletun matematiikan alan tutkijoiden huomion. Tämän seurauksena R. Fischerin teokset, jotka syntyivät vuonna 20s, johti erotteluanalyysin muodostumiseen - yksi hahmontunnistuksen teorian ja käytännön osioista. AT 40-luku A. N. Kolmogorov ja A. Ya. Khinchin asettivat tavoitteeksi kahden jakauman sekoituksen erottamisen. Ja sisään 50-60 luvulla 1900-luvulla ilmestyi lukuisten teosten perusteella tilastollisten päätösten teoria. Kybernetiikan puitteissa alkoi muotoutua uusi suunta, joka liittyy teoreettisten perusteiden kehittämiseen ja mekanismien sekä esineiden ja prosessien tunnistamiseen suunniteltujen järjestelmien käytännön toteutukseen. Uuden tieteenalan nimi oli "Kuvion tunnistus".

Hahmontunnistus(objektit) on tehtävä tunnistaa esine sen kuvan (optinen tunnistus), äänitallenteen (akustinen tunnistus) tai muiden ominaisuuksien perusteella. Kuva- Tämä on luokitteluryhmä, jonka avulla voit yhdistää objektiryhmän tiettyjen kriteerien mukaan. Kuvilla on ominainen piirre, joka ilmenee siinä, että tutustuminen rajalliseen määrään ilmiöitä yhdestä sarjasta mahdollistaa suuren joukon sen edustajia. Tunnistusongelman klassisessa muotoilussa joukko on jaettu osiin.

Yksi perusmääritelmistä on myös käsite sarjat. Tietokoneessa joukko on joukko samantyyppisiä ei-toistuvia elementtejä. "Ei-toistuva" tarkoittaa, että elementti joko on joukossa tai ei. Yleissarja sisältää kaikki mahdolliset elementit, tyhjä sarja ei sisällä yhtään.

Menetelmää, jolla elementti määritetään jollekin kuvalle, kutsutaan päätöksen sääntö. Toinen tärkeä käsite on mittareita- määrittää joukon elementtien välisen etäisyyden. Mitä pienempi tämä etäisyys on, sitä samankaltaisempia ovat kohteet (symbolit, äänet jne.), jotka tunnistamme. Oletuksena elementit määritetään numerojoukoksi ja metriikka jonkinlaiseksi funktioksi. Ohjelman tehokkuus riippuu kuvan esitystavan valinnasta ja metriikan toteutuksesta: sama tunnistusalgoritmi eri mittareilla tekee virheitä eri taajuuksilla.

oppimista kutsutaan tavallisesti prosessiksi, jossa jossain järjestelmässä kehitetään erityinen reaktio ulkoisten samankaltaisten signaalien tekijöihin niiden toistuvalla vaikutuksella järjestelmään. itseopiskelu eroaa koulutuksesta siinä, että tässä ei ilmoiteta järjestelmään lisätietoa reaktiosta.

Esimerkkejä hahmontunnistusongelmista ovat:

Kirjeen tunnustaminen;

Viivakoodin tunnistus;

Rekisterikilpien tunnistaminen;

Kasvojen ja muiden biometristen tietojen tunnistus;

Puheentunnistus jne.

1.1 Tarina kehitystä

1950-luvun puoliväliin mennessä R. Penrose asetti kyseenalaiseksi aivojen hermoverkkomallin ja huomautti kvanttimekaanisten vaikutusten olennaisen roolin sen toiminnassa. Tämän perusteella F. Rosenblatt kehitti visuaalisen hahmontunnistuksen oppimismallin nimeltä perceptron.

Kuva1 - Perceptronin kaavio

Lisäksi perceptronista keksittiin erilaisia ​​yleistyksiä, ja hermosolujen toiminta oli monimutkaista: neuronit eivät pystyneet vain kertomaan syötelukuja ja vertailla tulosta kynnysarvoihin, vaan myös soveltamaan niihin monimutkaisempia toimintoja. Kuvassa 2 on yksi näistä komplikaatioista:

Riisi. 2 Neuroverkon kaavio.

Lisäksi hermoverkon topologia voisi olla vieläkin monimutkaisempi. Esimerkiksi näin:

Kuva 3 - Kaavio Rosenblattin hermoverkosta.

Neuroverkot, jotka ovat monimutkainen matemaattisen analyysin objekti, mahdollistivat niiden oikealla käytöllä hyvin yksinkertaisten datalakien löytämisen. Mutta tämä etu on myös mahdollisten virheiden lähde. Analyysin vaikeus selittyy yleensä vain monimutkaisella rakenteella, mutta sen seurauksena käytännössä ehtymättömät mahdollisuudet yleistää monenlaisia ​​säännönmukaisuuksia.

1.2 Luokitusmenetelmiätunnustaminenkuvia

Kuten olemme jo todenneet, hahmontunnistus on tehtävä ekvivalenssisuhteiden luomiseksi tiettyjen esineiden kuvien-mallien välille todellisessa tai ideaalisessa maailmassa.

Nämä suhteet määräävät tunnistettavien objektien kuulumisen joihinkin luokkiin, joita pidetään itsenäisinä itsenäisinä yksiköinä.

Tunnistusalgoritmeja rakentaessaan nämä luokat voi määrittää tutkija, joka käyttää omia ideoitaan tai käyttää lisätietoa objektien samankaltaisuudesta tai erosta tietyn tehtävän yhteydessä. Tässä tapauksessa puhutaan "tunnistuksesta opettajan kanssa". Toisessa, ts. kun automatisoitu järjestelmä ratkaisee luokitusongelman ilman lisäinformaatiota, puhutaan "valvomattomasta tunnistamisesta".

Teoksissa V.A. Duke antaa akateemisen katsauksen tunnistusmenetelmistä ja käyttää kahta päätapaa edustaa tietoa:

Intensionaalinen (attribuuttien välisten suhteiden kaavion muodossa);

Laajenna tiettyjen tosiasioiden (objektien, esimerkkien) avulla.

Intensionaalinen esitys kaappaa kuviot, jotka selittävät datan rakenteen. Diagnostisten tehtävien osalta tällainen kiinnitys koostuu kohteiden ominaisuuksien toimintojen määrittämisestä, jotka johtavat haluttuun tulokseen. Intensionaaliset esitykset toteutetaan arvojen operaatioilla, eivätkä ne sisällä operaatioita tietyille objekteille.

Tiedon laajennetut esitykset puolestaan ​​liittyvät aihealueen tiettyjen objektien kuvaukseen ja kiinnittämiseen ja ne toteutetaan operaatioissa, joiden elementit ovat objekteja itsenäisinä järjestelminä.

Siten V.A.:n ehdottama tunnistusmenetelmien luokittelu. Duke, määritellään perustavanlaatuisia säännönmukaisuuksia, jotka ovat periaatteessa ihmisen kognitiivisen tavan taustalla. Tämä asettaa tämän luokkajaon erityisasemaan verrattuna muihin vähemmän tunnettuihin luokitteluihin, jotka tätä taustaa vasten näyttävät keinotekoisilta ja epätäydelliseltä.

2. menetelmäthahmontunnistus

Iterointimenetelmä. Tässä menetelmässä vertailu tehdään tiettyyn tietokantaan, jossa jokaiselle kohteelle on eri vaihtoehtoja näytön muokkaamiseen. Esimerkiksi optisessa kuvantunnistuksessa voit käyttää iterointimenetelmää eri kulmissa tai mittakaavassa, siirtymissä, muodonmuutoksissa jne. Kirjaimissa voit iteroida fontin tai sen ominaisuuksien yli. Äänikuvantunnistuksen tapauksessa on olemassa vertailu joihinkin tunnettuihin malleihin (monen ihmisen puhuma sana). Lisäksi suoritetaan syvällisempi analyysi kuvan ominaisuuksista. Optisen tunnistuksen tapauksessa tämä voi olla geometristen ominaisuuksien määritelmä. Tässä tapauksessa ääninäytteelle tehdään taajuus- ja amplitudianalyysi.

Seuraava menetelmä on keinotekoisten neuroverkkojen käyttö(INS). Se vaatii joko valtavan määrän esimerkkejä tunnistustehtävästä tai erityisen hermoverkkorakenteen, joka ottaa huomioon tämän tehtävän erityispiirteet. Mutta kuitenkin, tälle menetelmälle on ominaista korkea tehokkuus ja tuottavuus.

Menetelmät, jotka perustuvat piirrearvojen jakautumistiheyksien arvioihin. Lainattu klassisesta tilastollisten päätösten teoriasta, jossa tutkimuskohteita pidetään moniulotteisen satunnaismuuttujan realisaatioina, jotka ovat jakautuneet piirreavaruuteen jonkin lain mukaan. Ne perustuvat Bayesin päätöksentekokaavioon, joka vetoaa tiettyyn luokkaan kuuluvien objektien alkutodennäköisyyksiin ja ehdollisiin piirteiden jakautumistiheyksiin.

Piirrearvojen jakautumistiheyksien estimointiin perustuva menetelmäryhmä liittyy suoraan erotteluanalyysin menetelmiin. Bayesin lähestymistapa päätöksentekoon on yksi kehittyneimmistä parametrisista menetelmistä nykytilastoissa, jolle jakauman lain (normaalilaki) analyyttisen ilmaisun katsotaan tunnetuksi ja vain pieni määrä parametreja (keskiarvovektorit ja kovarianssimatriisit) ) on arvioitava. Tämän menetelmän soveltamisen päävaikeudeksi katsotaan tarve muistaa koko opetusnäyte tiheysestimaattien laskemiseksi ja suuri herkkyys opetusnäytteelle.

Päätösfunktioiden luokkaa koskeviin oletuksiin perustuvat menetelmät. Tässä ryhmässä päätösfunktion tyyppi katsotaan tiedoksi ja sen laatufunktio on annettu. Tämän funktion perusteella optimaalinen approksimaatio päätösfunktiolle löydetään opetussekvenssistä. Päätössäännön laatufunktio liittyy yleensä virheeseen. Menetelmän tärkein etu on tunnistusongelman matemaattisen muotoilun selkeys.Mahdollisuus poimia uutta tietoa kohteen luonteesta, erityisesti tietoa attribuuttien vuorovaikutusmekanismeista, on tässä pohjimmiltaan rajoitettu tietyllä rakenteella. vuorovaikutuksen, joka on kiinnitetty valittuun päätöstoimintojen muotoon.

Prototyyppien vertailumenetelmä. Tämä on käytännössä helpoin laajennusmenetelmä. Sitä sovelletaan, kun tunnistettavat luokat esitetään kompakteina geometrisina luokkina. Sitten geometrisen ryhmittelyn keskipiste (tai keskustaa lähinnä oleva kohde) valitaan prototyyppipisteeksi.

Määrittämättömän kohteen luokittelemiseksi löydetään sitä lähinnä oleva prototyyppi ja kohde kuuluu samaan luokkaan kuin se. Ilmeisesti tällä menetelmällä ei muodostu yleistettyjä kuvia. Mittana voidaan käyttää erilaisia ​​etäisyyksiä.

k lähimmän naapurin menetelmä. Menetelmä piilee siinä, että kun luokitellaan tuntematon objekti, löydetään tietty määrä (k) geometrisesti lähintä piirreavaruutta muista lähimpien naapureiden, joiden luokkaan kuuluminen on jo tiedossa. Päätös tuntemattoman kohteen osoittamisesta tehdään analysoimalla tietoja sen lähimmistä naapureista. Tarve vähentää harjoitusnäytteen objektien määrää (diagnostiset ennakkotapaukset) on tämän menetelmän haitta, koska tämä vähentää harjoitusnäytteen edustavuutta.

Sen perusteella, että eri tunnistusalgoritmit käyttäytyvät eri tavalla samassa otoksessa, herää kysymys synteettisestä päätössäännöstä, joka käyttäisi kaikkien algoritmien vahvuuksia. Tätä varten on olemassa synteettinen menetelmä tai päätössääntösarjat, jotka yhdistävät kunkin menetelmän myönteisimmät puolet.

Tunnistusmenetelmien katsauksen päätteeksi esitämme edellä olevan olemuksen yhteenvetotaulukossa, johon on lisätty joitain muita käytännössä käytettyjä menetelmiä.

Taulukko 1. Tunnistusmenetelmien luokitustaulukko, niiden käyttöalueiden vertailu ja rajoitukset

Tunnistusmenetelmien luokittelu

Sovellusalue

Rajoitukset (haitat)

Intensiiviset tunnistusmenetelmät

Tiheysarvioihin perustuvat menetelmät

Ongelmia tunnetussa jakaumassa (normaali), tarve kerätä suuria tilastoja

Tarve luetella koko koulutussarja tunnistuksen aikana, suuri herkkyys koulutussarjan ja esineiden epäedustavuudelle

Oletuksiin perustuvat menetelmät

Luokkien tulee olla hyvin erotettavissa

Päätösfunktion muoto on tiedettävä etukäteen. Uutta tietoa ominaisuuksien välisistä korrelaatioista ei voida ottaa huomioon

Boolen menetelmät

Pienen mittasuhteen ongelmat

Kun valitset loogisia päätössääntöjä, täydellinen luettelointi on välttämätön. Korkea työvoimaintensiteetti

Kielelliset menetelmät

Tehtävä määrittää kielioppi tietylle lausejoukolle (objektien kuvauksille) on vaikea formalisoida. Ratkaisemattomia teoreettisia ongelmia

Laajennetut tunnistusmenetelmät

Prototyyppien vertailumenetelmä

Ominaisuustilan pienen ulottuvuuden ongelmat

Luokittelutulosten suuri riippuvuus metriikasta. Tuntematon optimaalinen mittari

k lähimmän naapurin menetelmä

Luokittelutulosten suuri riippuvuus metriikasta. Koulutusnäytteen täydellinen luettelointi tunnistuksen aikana. Laskennallinen monimutkaisuus

Arvosanan laskentaalgoritmit (ABO)

Pienikokoiset ongelmat luokkien ja ominaisuuksien suhteen

Luokittelutulosten riippuvuus metriikasta. Koulutusnäytteen täydellinen luettelointi tunnistuksen aikana. Menetelmän tekninen monimutkaisuus

Collective Decision Regulations (CRC) on synteettinen menetelmä.

Pienikokoiset ongelmat luokkien ja ominaisuuksien suhteen

Menetelmän erittäin tekninen monimutkaisuus, ratkaisemattomien teoreettisten ongelmien määrä sekä tiettyjen menetelmien toimivalta-alueiden määrittelyssä että itse menetelmissä

3. Kuviontunnistusongelmien yleispiirteet ja niiden tyypit

Tunnistusjärjestelmän yleinen rakenne ja sen vaiheet on esitetty kuvassa 4:

Kuva 4 - Tunnistusjärjestelmän rakenne

Tunnistustehtävillä on seuraavat tyypilliset vaiheet:

Alkutietojen muuntaminen sopivaan muotoon tunnistamista varten;

Tunnistus (osoittaa, että esine kuuluu tiettyyn luokkaan).

Näissä tehtävissä voidaan ottaa käyttöön objektien samankaltaisuuden käsite ja muotoilla sääntöjoukko, jonka perusteella objekti määrätään yhteen tai eri luokkiin.

Voidaan myös toimia esimerkkijoukolla, jonka luokittelu on tiedossa ja jotka annettujen kuvausten muodossa voidaan ilmoittaa tunnistusalgoritmille sovitettavaksi oppimisprosessin tehtävään.

Tunnistusongelmien ratkaisemiseen liittyvät vaikeudet liittyvät kyvyttömyyteen soveltaa klassisia matemaattisia menetelmiä ilman korjauksia (usein tarkkaan matemaattiseen malliin ei ole saatavilla tietoa)

On olemassa seuraavan tyyppisiä tunnistustehtäviä:

Tunnistustehtävä on esitettävän objektin antaminen sen kuvauksen mukaan jollekin annetuista luokista (koulutus opettajan kanssa);

Automaattisen luokituksen tehtävänä on jakaa joukko ei-päällekkäisten luokkien järjestelmäksi (taksonomia, klusterianalyysi, itseoppiminen);

Informatiivisen attribuuttijoukon valinnan ongelma tunnistamisessa;

Tehtävä saattaa alkutiedot sopivaan muotoon;

Dynaaminen tunnistus ja luokittelu;

Ennustetehtävä - eli päätöksen tulee koskea tiettyä hetkeä tulevaisuudessa.

Nykyisissä tunnistusjärjestelmissä on kaksi vaikeinta ongelmaa:

"1001 luokan" ongelma - 1 luokan lisääminen 1000 olemassa olevaan aiheuttaa vaikeuksia järjestelmän uudelleenkoulutuksessa ja aiemmin saatujen tietojen tarkistamisessa;

"Sanaston ja lähteiden korrelaation" ongelma ilmenee voimakkaimmin puheentunnistuksessa. Nykyiset järjestelmät voivat tunnistaa joko suuren määrän sanoja pieneltä ryhmältä yksilöitä tai muutaman sanan suurelta ryhmältä yksilöitä. On myös vaikeaa tunnistaa suurta määrää meikkiä tai grimasseja sisältäviä kasvoja.

Neuroverkot eivät ratkaise näitä ongelmia suoraan, mutta luonteensa vuoksi ne mukautuvat paljon helpommin syöttösekvenssien muutoksiin.

4. Ongelmat ja näkymätkehitystähahmontunnistus

4.1 Kuviontunnistuksen soveltaminen käytännössä

Yleensä kuviontunnistusongelma koostuu kahdesta osasta: oppimisesta ja tunnistamisesta. Oppiminen tapahtuu näyttämällä itsenäisiä objekteja niiden kohdistamisen kanssa yhteen tai toiseen luokkaan. Harjoittelun tuloksena tunnistusjärjestelmän tulee saada kyky reagoida samoilla reaktioilla yhden kuvan kaikkiin esineisiin ja eri reaktioihin kaikkiin muihin. On tärkeää, että oppimisprosessissa ilmoitetaan vain itse esineet ja niiden kuuluvuus kuvaan. Koulutusta seuraa tunnistusprosessi, joka luonnehtii jo koulutetun järjestelmän toimintaa. Ongelmana on näiden menettelyjen automatisointi.

Ennen kuin aloitat minkä tahansa kohteen analyysin, on tarpeen hankkia siitä tietyt, jollakin tavalla järjestetyt, tarkat tiedot. Tällainen tieto on joukko esineiden ominaisuuksia, niiden näyttö tunnistusjärjestelmän havaitsevien elinten joukossa.

Mutta jokainen havaintokohde voi toimia eri tavalla havaintoolosuhteista riippuen. Lisäksi saman kuvan kohteet voivat olla hyvin erilaisia ​​keskenään.

Jokaista minkä tahansa kohteen kartoittamista tunnistusjärjestelmän havaitseviin elimiin, riippumatta sen sijainnista näihin elimiin nähden, kutsutaan yleensä kohteen kuvaksi, ja tällaisten kuvien joukot, joita yhdistävät eräät yhteiset ominaisuudet, ovat kuvia. Alkukuvauksen (ominaisuustilan) onnistuneella valinnalla tunnistustehtävä voi osoittautua varsin helpoksi, ja päinvastoin, epäonnistunut valinta voi johtaa erittäin vaikeaan tiedon jatkokäsittelyyn tai jopa ratkaisun puuttumiseen. .

Esineiden, signaalien, tilanteiden, ilmiöiden tunnistaminen on yleisin tehtävä, joka ihmisen on ratkaistava joka sekunti. Tätä varten käytetään valtavia aivoresursseja, jotka arvioidaan sellaisella indikaattorilla kuin neuronien lukumäärä, joka on yhtä suuri kuin 10 10 .

Myös tunnustusta kohdataan jatkuvasti tekniikassa. Muodollisten neuronien verkostoissa tehtävät laskelmat muistuttavat monella tapaa aivojen tiedonkäsittelyä. Viime vuosikymmenen aikana neurotietokoneista on tullut erittäin suosittuja ja se on onnistunut muuttumaan kaupallisten tuotteiden tuotantoon liittyväksi tekniikaksi. Neurolaskennan elementtipohjan luomiseksi on meneillään suuri työ.

Niiden pääominaisuus on kyky ratkaista ei-formalisoituja ongelmia, joille syystä tai toisesta ei odoteta ratkaisualgoritmeja. Neurotietokoneet tarjoavat suhteellisen yksinkertaisen tekniikan algoritmien hankkimiseen koulutuksen kautta. Tämä on heidän tärkein etunsa. Siksi neurotietokoneilla on merkitystä juuri nyt - multimedian kukoistusaikoina, jolloin globaali kehitys vaatii uusien hahmontunnistustamiseen läheisesti liittyvien teknologioiden kehittämistä.

Yksi tekoälyn kehittämisen ja soveltamisen suurimmista ongelmista on edelleen äänen ja visuaalisen kuvan tunnistamisen ongelma. Kaikki muut tekniikat ovat jo valmiita löytämään sovelluksensa lääketieteessä, biologiassa ja turvajärjestelmissä. Lääketieteessä hahmontunnistus auttaa lääkäreitä tekemään tarkempia diagnooseja, tehtaissa sitä käytetään tavaraerien virheiden ennustamiseen. Biometriset tunnistusjärjestelmät algoritmisena ytimenään perustuvat myös tunnistustuloksiin. Sellaisten tietokoneiden jatkokehitys ja suunnittelu, jotka pystyvät kommunikoimaan ihmisen kanssa suoremmin luonnollisilla kielillä ihmisille ja puheen kautta, on ratkaisematonta ilman tunnistusta. Tässä herää jo kysymys robotiikan, keinotekoisten ohjausjärjestelmien kehittämisestä, jotka sisältävät tunnistusjärjestelmät elintärkeinä osajärjestelminä.

Johtopäätös

Työn tuloksena tehtiin lyhyt katsaus sellaisen kybernetiikan osan, kuten hahmontunnistuksen, käsitteiden päämäärittelyihin, tunnistettiin tunnistusmenetelmät ja muotoiltiin tehtäviä.

Tietenkin tämän tieteen kehitykselle on monia suuntauksia. Lisäksi, kuten yhdessä luvussa muotoiltiin, tunnustaminen on tällä hetkellä yksi keskeisistä kehittämiskohteista. Näin ollen ohjelmistot voivat tulevina vuosikymmeninä olla entistä houkuttelevampia käyttäjälle ja kilpailukykyisemmiksi nykyaikaisilla markkinoilla, jos ne hankkivat kaupallisen muodon ja alkavat levitä suurelle joukolle kuluttajia.

Jatkotutkimusta voidaan suunnata seuraaviin näkökohtiin: tärkeimpien prosessointimenetelmien syvällinen analyysi ja uusien yhdistettyjen tai muunnettujen tunnistusmenetelmien kehittäminen. Tehdyn tutkimuksen perusteella on mahdollista kehittää toiminnallinen tunnistusjärjestelmä, jolla on mahdollista testata valittujen tunnistusmenetelmien tehokkuutta.

Bibliografia

1. David Formais, Jean Pons Tietokonenäkö. Moderni lähestymistapa, 2004

2. Aizerman M.A., Braverman E.M., Rozonoer L.I. Mahdollisten funktioiden menetelmä koneoppimisen teoriassa. - M.: Nauka, 2004.

3. Zhuravlev Yu.I. Algebrallisesta lähestymistavasta tunnistus- tai luokitteluongelmien ratkaisemiseen // Kybernetiikan ongelmat. M.: Nauka, 2005. - Numero. 33.

4. Mazurov V.D. Eriarvoisuusjärjestelmien ja tunnistusongelman komiteat // Kybernetiikka, 2004, nro 2.

5. Potapov A.S. Kuvioiden tunnistus ja koneen havaitseminen. - Pietari: ammattikorkeakoulu, 2007.

6. Minsky M., Papert S. Perceptrons. - M.: Mir, 2007.

7. Rastrigin L. A., Erenshtein R. Kh. Yhteisen tunnustamisen menetelmä. M. Energoizdat, 2006.

8. Rudakov K.V. Luokitusongelmien universaalien ja paikallisten rajoitteiden algebrallisesta teoriasta // Tunnistus, luokittelu, ennuste. Matemaattiset menetelmät ja niiden soveltaminen. Ongelma. 1. - M.: Nauka, 2007.

9. Fu K. Rakenteelliset menetelmät hahmontunnistuksessa. - M.: Mir, 2005.

Isännöi Allbest.ru:ssa

...

Samanlaisia ​​asiakirjoja

    Kuviontunnistusteorian peruskäsitteet ja sen merkitys. Kuviontunnistuksen matemaattisen teorian ydin. Kuviontunnistusjärjestelmien kehittämisen päätehtävät. Reaaliaikaisten kuviontunnistusjärjestelmien luokittelu.

    lukukausityö, lisätty 15.1.2014

    Kuviontunnistusalgoritmien rakentamisen käsite ja ominaisuudet. Erilaisia ​​lähestymistapoja tunnistusmenetelmien typologiaan. Tutkimus tärkeimmistä tavoista esittää tietoa. Intensio- ja ekstensiomenetelmien karakterisointi, niiden laadun arviointi.

    esitys, lisätty 1.6.2014

    Kuviontunnistuksen teoreettiset perusteet. Tunnistusjärjestelmän toimintakaavio. Bayesin menetelmien soveltaminen hahmontunnistuksen ongelman ratkaisemiseen. Bayesin kuvan segmentointi. TAN-malli kuvan luokittelun ongelman ratkaisemiseksi.

    opinnäytetyö, lisätty 13.10.2017

    Katsaus hahmontunnistusjärjestelmien kehittämisessä nouseviin tehtäviin. Koulutettavat kuvan luokittimet. Perceptron-algoritmi ja sen muunnelmat. Ohjelman luominen, joka on suunniteltu luokittelemaan kuvia pienimmän keskiarvon menetelmällä.

    lukukausityö, lisätty 5.4.2015

    Kuviontunnistusmenetelmät (luokittimet): Bayesin, lineaarinen, potentiaalifunktioiden menetelmä. Ohjelman kehittäminen henkilön tunnistamiseksi valokuvista. Esimerkkejä luokittimien työstä, kokeellisia tuloksia menetelmien tarkkuudesta.

    lukukausityö, lisätty 15.8.2011

    Keinotekoisiin hermoverkkoihin perustuvan visuaalisen kuvantunnistuksen suorittavan ohjelmistotyökalun luominen. Kuviontunnistukseen käytetyt menetelmät. Pandemonium Selfridge. Perceptron Rosenblatt. Ketjukoodin muodostussääntö.

    opinnäytetyö, lisätty 6.4.2014

    Kuviontunnistus on tehtävä tunnistaa kohde tai määrittää sen ominaisuudet sen kuva- tai äänitallenteen perusteella. Alan teoreettisen ja teknisen kehityksen historia. Tunnustuksen laskennassa käytetyt menetelmät ja periaatteet.

    tiivistelmä, lisätty 10.4.2010

    Kuviontunnistusjärjestelmän käsite. Tunnistusjärjestelmien luokittelu. Mikroobjektien muodon tunnistamisjärjestelmän kehittäminen. Algoritmi järjestelmän luomiseksi mikroobjektien tunnistamiseksi kristallogrammista, sen toteutuksen piirteet ohjelmistoympäristössä.

    lukukausityö, lisätty 21.6.2014

    Neuroverkon tyypin ja rakenteen valinta. Tunnistusmenetelmän valinta, lohkokaavio Hopfield-verkosta. Kuviontunnistusjärjestelmän koulutus. Ohjelman kanssa työskentelyn ominaisuudet, sen edut ja haitat. Käyttöliittymän ja näyttömuotojen kuvaus.

    lukukausityö, lisätty 14.11.2013

    Automaattisen tunnistamisen teknisten järjestelmien syntyminen. Ihminen monimutkaisten automaattisten järjestelmien elementtinä tai linkkinä. Automaattisten tunnistuslaitteiden mahdollisuudet. Kuvantunnistusjärjestelmän luomisen vaiheet. Mittaus- ja koodausprosessit.