Mustrituvastussüsteemid maailma inforessurssides. Olemasolevate mustrituvastusmeetodite ülevaade. Näiteid mustrituvastusprobleemidest

3. peatükk: Mustri tuvastamise (identifitseerimise) süsteemid

  • Kujutise mõiste. Mustrituvastuse õpetamise probleem. Geomeetrilised ja struktuurilised lähenemised. Kompaktsuse hüpotees. Koolitus ja iseõppimine. Kohanemine ja treenimine.
  • Mustrituvastuse õpetamise meetodid - pertseptronid, närvivõrgud, potentsiaalsete funktsioonide meetod, argumentide grupiarvestuse meetod, äärmuslike lihtsustuste meetod, otsustusreeglite rühmad.
  • Mitmemõõtmeliste andmete struktuuri analüüsimise meetodid ja algoritmid - klasteranalüüs, hierarhiline rühmitamine.

Kujutise kontseptsioon

Pilt, klass - liigitusrühmitus klassifikatsioonisüsteemis, mis ühendab (tõstab esile) teatud objektide rühma mingi kriteeriumi järgi.

Kujutlusvõimeline maailmataju on üks elava aju salapäraseid omadusi, mis võimaldab mõista tajutava teabe lõputut voogu ja säilitada orientatsiooni välismaailma erinevate andmete ookeanis. Välismaailma tajumisel klassifitseerime alati tajutavad aistingud ehk jagame need sarnaste, kuid mitte identsete nähtuste rühmadesse. Näiteks, vaatamata olulisele erinevusele kuuluvad ühte rühma kõik erineva käekirjaga kirjutatud tähed A või kõik samale noodile vastavad helid, mida mängitakse mis tahes oktaavis ja mis tahes instrumendil ning tehnilist objekti kontrolliv operaator hõlmab tervet komplekti olekuid. objekt reageerib sama reaktsiooniga. On iseloomulik, et teatud klassi arusaamade rühma kohta kontseptsiooni sõnastamiseks piisab, kui tutvuda väikese arvu selle esindajatega. Lapsele võib tähte näidata vaid korra, et ta leiaks selle tähe erinevates kirjatüüpides kirjutatud tekstist üles või tunneks selle ära, isegi kui see on kirjutatud sihilikult moonutatud kujul. See aju omadus võimaldab sõnastada sellise kontseptsiooni kujutisena.

Piltidel on iseloomulik omadus, mis väljendub selles, et samast komplektist piiratud arvu nähtustega tutvumine võimaldab ära tunda meelevaldselt suure hulga selle esindajaid. Kujutised võivad olla näiteks: jõgi, meri, vedelik, Tšaikovski muusika, Majakovski luule jne. Kujutisena võib käsitleda ka kontrollobjekti teatud olekute kogumit ja kogu seda olekute kogumit iseloomustab asjaolu et etteantud eesmärgi saavutamiseks sama mõju objektile. Piltidel on iseloomulikud objektiivsed omadused selles mõttes, et erinevad inimesed, kes on saanud erineva vaatlusmaterjali järgi, klassifitseerivad samu objekte enamasti ühtemoodi ja üksteisest sõltumatult. Just see piltide objektiivsus võimaldab inimestel üle kogu maailma üksteist mõista.

Võime tajuda välismaailma kujutiste kujul võimaldab teatud usaldusväärsusega ära tunda lõpmatu hulga objekte nende lõpliku arvuga tutvumise põhjal ning kujutiste põhiomaduse objektiivne olemus võimaldab modelleerida nende äratundmise protsess. Objektiivse reaalsuse peegeldusena on kujundi mõiste sama objektiivne kui tegelikkus ise ja seetõttu võib see mõiste ise olla erilise uurimise objekt.

Õppimismalli tuvastamise (PR) probleemile pühendatud kirjanduses tuuakse kujundi mõiste asemel sageli klassi mõiste.

Õppimismustrite tuvastamise (PRT) probleem

Inimese aju üks huvitavamaid omadusi on võime reageerida lõputule hulgale keskkonnatingimustele piiratud arvu reaktsioonidega. Võib-olla oli just see omadus, mis võimaldas inimesel saavutada elusaine kõrgeima eksistentsi vormi, mis väljendub võimes mõelda, st peegeldada aktiivselt objektiivset maailma piltide, mõistete, hinnangute jne kujul. Seetõttu on probleem ORR tekkis aju füsioloogiliste omaduste uurimisel.

Vaatleme näidet probleemidest ODO valdkonnast.


Riis. 1

Siin on 12 ülesannet, mille puhul peaksite valima funktsioonid, mille abil saab eristada vasakpoolset piltide kolmkõla paremast. Nende probleemide lahendamine eeldab loogilise mõtlemise täielikku modelleerimist.

Üldiselt koosneb mustrituvastuse probleem kahest osast: koolitusest ja äratundmisest. Treening viiakse läbi üksikute objektide näitamisega, mis näitab nende kuuluvust ühe või teise pildi juurde. Koolituse tulemusena peab äratundmissüsteem omandama oskuse reageerida samade reaktsioonidega kõikidele sama pildi objektidele ja erinevate reaktsioonidega kõikidele erineva kujutisega objektidele. On väga oluline, et õppeprotsess lõppeks ainult piiratud arvu objektide näitamisega ilma muude viipadeta. Õpiobjektideks võivad olla pildid või muud visuaalsed kujutised (tähed) või erinevad välismaailma nähtused, näiteks helid, keha seisund meditsiinilise diagnoosi ajal, tehnilise objekti seisund juhtimissüsteemides jne. on oluline, et õppeprotsessi käigus ainult objektid ja nende kuuluvus pildile. Treeningule järgneb uute objektide äratundmise protsess, mis iseloomustab juba treenitud süsteemi tegevust. Nende protseduuride automatiseerimine on mustrite tuvastamise õpetamise probleem. Juhul, kui inimene selle ise lahendab või leiutab ja seejärel masinale klassifitseerimisreegli kehtestab, on äratundmisprobleem osaliselt lahendatud, kuna inimene võtab enda peale probleemi põhi- ja põhiosa (koolituse).

Mustrituvastuse õpetamise probleem on huvitav nii rakenduslikust kui ka fundamentaalsest vaatenurgast. Rakenduslikust vaatenurgast on selle probleemi lahendamine oluline eelkõige seetõttu, et see avab võimaluse automatiseerida paljusid protsesse, mida seni on seostatud vaid elava aju tegevusega. Probleemi põhimõtteline tähtsus on tihedalt seotud küberneetika ideede arenguga seoses üha enam kerkiva küsimusega: mida masin põhimõtteliselt teha saab ja mida mitte? Kuivõrd võivad masina võimalused olla lähedased elava aju omadele? Täpsemalt, kas masin suudab arendada inimese võimet teatud toimingute tegemiseks sõltuvalt keskkonnas tekkivatest olukordadest? Seni on selgunud vaid see, et kui inimene suudab oma oskuse esmalt ise realiseerida ja siis seda kirjeldada ehk näidata, miks ta igale väliskeskkonna seisundile reageerides toiminguid teeb või kuidas (millise reegli järgi) ta kombineerib. üksikud objektid kujutisteks, siis saab sellise oskuse ilma põhjapanevate raskusteta masinasse üle kanda. Kui inimesel on oskus, aga ta ei oska seda seletada, siis on oskuse ülekandmiseks masinasse ainult üks võimalus – näidete abil õpetamine.

Tunnistussüsteemide abil lahendatavate probleemide ring on äärmiselt lai. See hõlmab mitte ainult visuaalsete ja auditoorsete kujutiste äratundmise ülesandeid, vaid ka keerukate protsesside ja nähtuste äratundmise ülesandeid, mis tekivad näiteks ettevõtte juhi sobivate toimingute valimisel või tehnoloogilise, majandusliku, transpordi optimaalse juhtimise valimisel. või sõjalised operatsioonid. Igas nimetatud ülesandes analüüsitakse välismaailma teatud nähtusi, protsesse ja olekuid, mida edaspidi nimetatakse vaatlusobjektideks. Enne kui hakkate mõnda objekti analüüsima, peate selle kohta mingil viisil hankima kindlat, järjestatud teavet. Selline teave esindab objektide omadusi, nende kuvamist tuvastussüsteemi mitmesugustel tajuorganitel.

Kuid iga vaatlusobjekt võib sõltuvalt tajutingimustest mõjutada erinevalt. Näiteks võib iga tähte, isegi samamoodi kirjutatud, tajuorganite suhtes põhimõtteliselt mis tahes viisil nihutada. Lisaks võivad sama kujutisega objektid olla üksteisest üsna erinevad ja loomulikult mõjuvad nad tajuorganitele erinevalt.

Iga objekti kaardistamist tuvastussüsteemi tajuorganitele, olenemata selle asukohast nende organite suhtes, nimetatakse tavaliselt objekti kujutiseks ja selliste kujutiste komplektid, mida ühendavad mõned ühised omadused, on kujutised.

Juhtimisprobleemide lahendamisel mustrituvastusmeetodite abil kasutatakse mõiste „kujutis“ asemel mõistet „olek“. Olek on vaadeldava objekti mõõdetud voolu (või hetkeliste) omaduste kuvamise teatud vorm. Olekute kogum määrab olukorra. Mõiste "olukord" on analoogne mõistega "image". Kuid see analoogia pole täielik, sest mitte iga kujundit ei saa nimetada olukorraks, kuigi iga olukorda saab nimetada kujutiseks.

Tavaliselt nimetatakse olukorda keerulise objekti teatud olekute kogumiks, millest igaüht iseloomustavad objekti samad või sarnased omadused. Näiteks kui teatud juhtimisobjekti käsitletakse vaatlusobjektina, siis ühendab olukord selle objekti sellised olekud, milles tuleks rakendada samu juhtimistoiminguid. Kui vaatlusobjektiks on sõjamäng, siis ühendab olukord kõik mänguseisundid, mis nõuavad näiteks võimsat tankilööki õhutoetusega.

Objektide esialgse kirjelduse valik on üks ODO probleemi keskseid ülesandeid. Esialgse kirjelduse (tunnusruumi) eduka valiku korral võib äratundmisülesanne osutuda triviaalseks ja vastupidi, ebaõnnestunud esialgne kirjeldus võib kaasa tuua kas väga keerulise info edasise töötlemise või lahenduse puudumise. Näiteks kui lahendatakse värvi poolest erinevate objektide äratundmise probleem ja esialgseks kirjelduseks on valitud kaaluanduritelt saadavad signaalid, siis tuvastusprobleemi ei saa põhimõtteliselt lahendada.

Geomeetrilised ja struktuurilised lähenemised.

Iga kord, kui seisame silmitsi tundmatute probleemidega, tekib loomulik soov neid kujutada mõne kergesti arusaadava mudeli kujul, mis võimaldaks meil probleemi kontseptualiseerida mõistetes, mida meie kujutlusvõime hõlpsasti reprodutseerib. Ja kuna me eksisteerime ruumis ja ajas, on meie jaoks kõige arusaadavam probleemide ruumiline ajaline tõlgendamine.

Iga pilti, mis tekib treeningu või eksami ajal objekti vaatlemise tulemusena, saab esitada vektorina ja seega punktina mõnes tunnusruumis. Kui väidetakse, et piltide näitamisel on võimalik neid üheselt kahest (või mitmest) pildist omistada, siis väidetakse sellega, et mingis ruumis on kaks (või enam) piirkonda, millel puuduvad ühised punktid ja et pildid on punktid nendest piirkondadest. Igale sellisele alale saab anda nime, st anda pildile vastava nime.

Tõlgendagem nüüd mustrituvastuse õppimise protsessi geomeetrilise pildi kaudu, piirdudes praegu vaid kahe kujutise äratundmise juhtumiga. Eelteaduks loetakse vaid seda, et mingis ruumis on vaja eraldada kaks piirkonda ja näidatakse ainult nendest piirkondadest pärit punkte. Need alad ise ei ole ette määratud, see tähendab, et puudub teave nende piiride asukoha kohta ega reeglid, mis määraksid, kas punkt kuulub konkreetsesse piirkonda.

Koolituse käigus esitatakse nendest aladest juhuslikult valitud punktid ning antakse infot, millisesse alasse esitatavad punktid kuuluvad. Nende alade, st nende piiride asukoha kohta koolitusel lisainfot ei anta. Treeningu eesmärk on kas konstrueerida pind, mis eraldaks mitte ainult treeningprotsessi käigus näidatud punktid, vaid ka kõik muud nendesse aladesse kuuluvad punktid, või konstrueerida neid alasid piiravad pinnad nii, et igaüks neist sisaldab ainult üks pilt. Teisisõnu, koolituse eesmärk on konstrueerida kujutise vektoritest funktsioone, mis oleksid näiteks ühe pildi kõigis punktides positiivsed ja teise kujutise kõigis punktides negatiivsed. Kuna aladel puuduvad ühised punktid, on selliseid eraldavaid funktsioone alati terve hulk ja treeningu tulemusel tuleb üks neist konstrueerida.

Kui esitatavad pildid ei kuulu kahele, vaid suuremale hulgale piltidele, siis on ülesandeks konstrueerida treeningul näidatud punktide abil pind, mis eraldab üksteisest kõik nendele piltidele vastavad alad. Selle probleemi saab lahendada näiteks konstrueerides funktsiooni, mis võtab iga piirkonna punktide üle sama väärtuse ja erinevatest piirkondadest pärit punktide üle, peaks selle funktsiooni väärtus olema erinev.



Riis. 2 – kaks pilti.

Esmapilgul tundub, et vaid mõne punkti teadmisest piirkonnast ei piisa kogu ala isoleerimiseks. Tõepoolest, on võimalik märkida lugematu arv erinevaid alasid, mis sisaldavad neid punkte ja olenemata sellest, kuidas ala esiletõstv pind on nendest konstrueeritud, on alati võimalik märkida mõni muu ala, mis lõikub pinnaga ja sisaldab samal ajal näidatud punktid. Siiski on teada, et funktsiooni lähendamise probleem seda puudutava teabe põhjal piiratud punktide hulgas, mis on oluliselt kitsam kui kogu hulk, millel funktsioon on antud, on funktsioonide lähendamise tavaline matemaatiline probleem. Loomulikult eeldab selliste probleemide lahendamine teatud piirangute kehtestamist vaadeldavatele funktsioonide klassile ja nende piirangute valik sõltub sellest, millist teavet õpetaja saab õppeprotsessi käigus lisada. Üks selline vihje on piltide kompaktsuse hüpotees. Intuitiivselt on selge, et eraldusfunktsiooni lähendamine on seda lihtsam ülesanne, mida kompaktsemad ja kaugemal asuvad eraldatavad piirkonnad. Nii näiteks joonisel fig. 2a, on eraldamine ilmselgelt lihtsam kui joonisel fig. 2b. Tõepoolest, joonisel fig. 2a, saab piirkondi tasapinnaga eraldada ja isegi suurte vigade korral eraldamisfunktsiooni määramisel jätkab see piirkondade eraldamist. Joonisel fig. 2b, eraldamine toimub keeruka pinnaga ja isegi väikesed kõrvalekalded selle kujus põhjustavad eraldusvigu. Just see intuitiivne idee suhteliselt kergesti eraldatavatest piirkondadest viis kompaktsuse hüpoteesini.

Koos mustrituvastuse õpetamise probleemi geomeetrilise tõlgendamisega on veel üks lähenemine, mida nimetatakse struktuurseks või keeleliseks. Selgitagem keelelist lähenemist visuaalse pildituvastuse näitel. Esiteks tehakse kindlaks algmõistete kogum - piltidelt leitud tüüpilised fragmendid ja fragmentide suhtelise asukoha omadused - "vasak", "alumine", "sees" jne. Need algmõisted moodustavad sõnavara, mis võimaldab teil luua erinevaid loogilisi väiteid, mida mõnikord nimetatakse eeldusteks. Ülesandeks on valida suure hulga väidete hulgast, mida saaks nende mõistete abil konstrueerida, konkreetse juhtumi jaoks kõige olulisemad.

Järgmiseks, vaadates igalt pildilt piiratud ja võib-olla väikest arvu objekte, peate koostama nende piltide kirjelduse. Konstrueeritud kirjeldused peavad olema nii täielikud, et lahendataks küsimus, millise kujutise alla antud objekt kuulub. Lingvistilise lähenemise rakendamisel kerkib esile kaks ülesannet: algsõnastiku ehk tüüpiliste fragmentide komplekti konstrueerimine ja antud sõnastiku elementidest kirjeldusreeglite konstrueerimine.

Keelelise tõlgenduse raames tõmmatakse analoogia kujundite struktuuri ja keele süntaksi vahel. Soovi selle analoogia järele tingis võimalus kasutada matemaatilise lingvistika aparatuuri ehk meetodid on oma olemuselt süntaktilist laadi. Matemaatilise lingvistika aparaadi kasutamist piltide struktuuri kirjeldamiseks saab kasutada alles pärast seda, kui kujutised on segmenteeritud osadeks, st on välja töötatud sõnad tüüpiliste fragmentide kirjeldamiseks ja nende otsimise meetodid. Sõnavaliku tagamise eeltöö järel tekivad tegelikud keelelised ülesanded, mis koosnevad kirjelduste automaatse grammatilise parsimise ülesannetest kujutise tuvastamiseks. Samal ajal tekib iseseisev uurimisvaldkond, mis eeldab lisaks matemaatilise lingvistika aluste tundmisele ka tehnikate valdamist, mis on välja töötatud spetsiaalselt keelelise pilditöötluse jaoks.

Kompaktsuse hüpotees

Kui eeldada, et õppeprotsessi käigus kujuneb tunnusruum lähtuvalt kavandatud klassifikatsioonist, siis võib loota, et tunnusruumi spetsifikatsioon ise määrab omaduse, mille mõjul on selles ruumis olevad kujutised kergesti eraldatavad. Just need lootused, kui töö mustrituvastuse valdkonnas arenes, ajendasid kompaktsuse hüpoteesi esilekerkimist, mis väidab, et kujutised vastavad funktsiooniruumis kompaktsetele komplektidele. Praegu mõistame kompaktse komplekti abil teatud pildiruumi punktide "klompe", eeldades, et nende klastrite vahel on neid eraldavad haruldused.

Seda hüpoteesi ei saanud aga alati eksperimentaalselt kinnitada, kuid mis kõige tähtsam – need ülesanded, mille puhul kompaktsuse hüpotees oli hästi täidetud (joonis 2a), leidsid eranditult kõik lihtsa lahenduse. Ja vastupidi, need ülesanded, mille puhul hüpotees kinnitust ei leidnud (joonis 2b), jäid kas üldse lahendamata või lahendati suure raskusega lisanippe kasutades. See asjaolu seab vähemalt kahtluse alla kompaktsuse hüpoteesi paikapidavuse, sest mis tahes hüpoteesi ümberlükkamiseks piisab ühest seda eitavast näitest. Samas säilitas hüpoteesi rakendamine kõikjal, kus oli võimalik mustrite tuvastamise õpetamise probleem hästi lahendada, huvi selle hüpoteesi vastu. Kompaktsuse hüpotees ise on saanud märgiks äratundmisprobleemide rahuldava lahendamise võimalikkusest.

Kompaktsuse hüpoteesi sõnastamine viib meid abstraktse pildi mõistele lähedale. Kui ruumi koordinaadid on valitud juhuslikult, jaotuvad selles olevad pildid juhuslikult. Need asuvad ruumi mõnes osas tihedamalt kui teistes. Nimetagem mõnda juhuslikult valitud ruumi abstraktseks pildiks. Selles abstraktses ruumis on peaaegu kindlasti olemas kompaktsed punktide komplektid. Seetõttu võib kompaktsuse hüpoteesi kohaselt objektide komplekte, mis vastavad abstraktse ruumi kompaktsetele punktide kogumitele, põhjendatult nimetada antud ruumi abstraktseteks kujutisteks.

Koolitus ja iseõppimine. Kohanemine ja treenimine

Kõik joonisel fig. 1, iseloomusta õppeülesannet. Kõigis neis ülesannetes on toodud mitu näidet (koolitusjärjestus) õigesti lahendatud ülesannetest. Kui oleks võimalik märgata mõnda universaalset omadust, mis ei sõltu ei kujutiste olemusest ega nende kujutistest, vaid määrab ainult nende eraldamisvõime, siis koos tavapärase äratundmise õppimise ülesandega, kasutades teavet nende kuuluvuse kohta. objekt treeningjärjestusest ühele või teisele kujutisele Võimalik oleks püstitada teistsugune klassifitseerimisprobleem - nn juhendamata õppimisprobleem. Seda laadi ülesannet kirjeldaval tasandil saab sõnastada järgmiselt: süsteem esitatakse samaaegselt või järjestikku objektidega, ilma et oleks viidatud nende kuuluvusele kujutistesse. Süsteemi sisendseade kaardistab objektide komplekti kujutiste kogumile ja, kasutades eelnevalt mõnda sellele omast kujutise eraldatavuse omadust, loob nende objektide sõltumatu klassifikatsiooni. Pärast sellist iseõppimise protsessi peaks süsteem omandama võime ära tunda mitte ainult juba tuttavaid objekte (objekte koolitusjärjestusest), vaid ka neid, mida varem ei esitatud. Teatud süsteemi iseõppimise protsess on protsess, mille tulemusena omandab see süsteem ilma õpetaja korralduseta võime arendada identseid reaktsioone sama kujutisega objektide kujutistele ja erinevaid reaktsioone erinevate kujutiste kujutistele. . Õpetaja roll on sel juhul ainult soovitada süsteemile mingit objektiivset omadust, mis on kõikide piltide puhul sama ja määrab võime jagada palju objekte kujutisteks.

Selgub, et selline objektiivne omadus on piltide kompaktsuse omadus. Punktide suhteline asukoht valitud ruumis sisaldab juba teavet selle kohta, kuidas punktide kogumit tuleks jagada. See teave määrab pildi eraldatavuse omaduse, mis on piisav, et süsteem saaks ise pildituvastust õppida.

Enamik tuntud iseõppivaid algoritme on võimelised tuvastama ainult abstraktseid pilte, st kompaktseid komplekte antud ruumides. Nende erinevus seisneb ilmselt kompaktsuse mõiste vormistamises. See aga ei vähenda, mõnikord isegi suurendab iseõppivate algoritmide väärtust, kuna sageli ei ole pilte ise keegi eelnevalt määratlenud ning ülesandeks on kindlaks teha, millised kujutiste alamhulgad antud ruumis kujutavad pilte. Hea näide sellisest probleemipüstitusest on sotsioloogiline uurimus, kui inimeste rühmad tuvastatakse küsimuste kogumi põhjal. Probleemi sellisel mõistmisel genereerivad iseõppivad algoritmid varem tundmatut teavet piltide olemasolu kohta antud ruumis, millest kellelgi varem aimugi polnud.

Lisaks iseloomustab iseõppimise tulemus valitud ruumi sobivust konkreetse tunnustamise õppeülesande täitmiseks. Kui iseõppimise käigus tuvastatud abstraktsed kujundid kattuvad reaalsetega, siis on ruum hästi valitud. Mida abstraktsemad pildid reaalsetest erinevad, seda “ebamugavam” on valitud ruum konkreetse ülesande jaoks.

Õppimist nimetatakse tavaliselt protsessiks, kus teatud süsteemis arendatakse välja üks või teine ​​reaktsioon väliste identsete signaalide rühmadele korduva kokkupuute kaudu väliste kohanduste süsteemiga. Selliseid väliseid kohandusi koolitusel nimetatakse tavaliselt "preemiateks" ja "karistusteks". Selle kohanduse genereerimise mehhanism määrab peaaegu täielikult õppimisalgoritmi. Iseõppimine erineb koolitusest selle poolest, et siin ei anta lisateavet süsteemile reageerimise õigsuse kohta.

Kohanemine on süsteemi parameetrite ja struktuuri ning võimalusel ka juhtimistoimingute muutmise protsess, mis põhineb jooksval teabel, et saavutada süsteemi teatud olek esialgse ebakindluse ja muutuvate töötingimuste korral.

Õppimine on protsess, mille tulemusena süsteem omandab järk-järgult võime reageerida vajalike reaktsioonidega teatud kogumitele välismõjudele ning kohanemine on süsteemi parameetrite ja struktuuri kohandamine eesmärgiga saavutada vajalik kontrolli kvaliteet. välistingimuste pidevate muutuste taustal.

Ja märgid. Sellised probleemid lahenevad üsna sageli näiteks fooritulede järgi tänava ületamisel või möödumisel. Põleva foori värvi äratundmine ja liiklusreeglite tundmine võimaldab teha õige otsuse, kas hetkel tohib või ei saa tänavat ületada.

Bioloogilise evolutsiooni käigus lahendasid paljud loomad probleeme oma nägemis- ja kuulmisaparaadi abil. mustrituvastus piisavalt hea. Tehissüsteemide loomine mustrituvastus on endiselt keeruline teoreetiline ja tehniline probleem. Vajadus sellise tunnustamise järele tekib erinevates valdkondades – alates sõjalistest asjadest ja turvasüsteemidest kuni kõikvõimalike analoogsignaalide digiteerimiseni.

Traditsiooniliselt kuuluvad mustrituvastuse ülesanded tehisintellekti ülesannete hulka.

Juhised mustrituvastuses

Eristada saab kahte peamist suunda:

  • Elusolendite äratundmisvõimete uurimine, nende selgitamine ja modelleerimine;
  • Rakenduslike rakenduste üksikprobleemide lahendamiseks mõeldud seadmete konstrueerimise teooria ja meetodite väljatöötamine.

Probleemi ametlik avaldus

Mustrituvastus on lähteandmete määramine teatud klassi, tuvastades olulisi tunnuseid, mis iseloomustavad neid andmeid ebaoluliste andmete kogumassist.

Tuvastamisprobleemide püstitamisel püütakse kasutada matemaatilist keelt, üritades erinevalt tehisnärvivõrkude teooriast, kus aluseks on tulemuse saamine eksperimendi teel, asendada eksperiment loogilise arutluskäigu ja matemaatilise tõestusega.

Mustrituvastusprobleemides käsitletakse kõige sagedamini ühevärvilisi pilte, mis võimaldab vaadelda pilti kui funktsiooni tasapinnal. Kui arvestada tasapinnal seatud punkti T, kus funktsioon x(x,y) väljendab oma omadusi pildi igas punktis - heledus, läbipaistvus, optiline tihedus, siis on selliseks funktsiooniks pildi formaalne salvestamine.

Kõikide võimalike funktsioonide komplekt x(x,y) pinnal T- on olemas kõigi piltide komplekti mudel X. Kontseptsiooni tutvustamine sarnasused piltide vahel saate esitada äratundmisülesande. Sellise väite konkreetne tüüp sõltub tugevalt järgmistest tunnustamise etappidest vastavalt ühele või teisele lähenemisviisile.

Mustri tuvastamise meetodid

Optiliseks mustrituvastuseks saab kasutada meetodit, mille abil otsitakse läbi objekti vaate erinevate nurkade, mõõtkavade, nihkete jms all. Tähtede puhul tuleb sorteerida fondi, fondi atribuutide jms järgi.

Teine lähenemisviis on leida objekti kontuurid ja uurida selle omadusi (ühenduvus, nurkade olemasolu jne).

Teine lähenemisviis on kunstlike närvivõrkude kasutamine. See meetod nõuab kas suurt hulka tuvastusülesande näiteid (õigete vastustega) või spetsiaalset närvivõrgu struktuuri, mis arvestab selle ülesande eripäraga.

Perceptron kui mustrituvastusmeetod

F. Rosenblatt, tutvustades ajumudeli kontseptsiooni, mille ülesandeks on näidata, kuidas mõnes füüsilises süsteemis, mille struktuur ja funktsionaalsed omadused on teada, võivad tekkida psühholoogilised nähtused – kirjeldas ta kõige lihtsamat. diskrimineerimise katsed. Need katsed on täielikult seotud mustrituvastusmeetoditega, kuid erinevad selle poolest, et lahendusalgoritm ei ole deterministlik.

Lihtsaim eksperiment, millest saab teatud süsteemi kohta psühholoogiliselt olulist teavet, taandub sellele, et mudelile esitatakse kaks erinevat stiimulit ja see peab neile erineval viisil reageerima. Sellise eksperimendi eesmärk võib olla uurida nende spontaanse diskrimineerimise võimalust süsteemi poolt, kui eksperimenteerija ei sekku, või vastupidi, uurida sunniviisilist diskrimineerimist, mille käigus katsetaja püüab süsteemi koolitada. viima läbi nõutud klassifikatsiooni.

Pertseptronitreeningu katses esitatakse tavaliselt teatud piltide jada, mis hõlmab iga eristatava klassi esindajaid. Mõne mälu muutmise reegli kohaselt tugevdatakse vastuse õiget valikut. Seejärel esitatakse pertseptronile kontrollstiimul ja määratakse õige vastuse saamise tõenäosus antud klassi stiimulitele. Sõltuvalt sellest, kas valitud kontrollstiimul ühtib või ei ühti ühe treeningjärjestuses kasutatud kujutisega, saadakse erinevad tulemused:

  • 1. Kui kontrollstiimul ei ühti ühegi treeningstiimuliga, siis ei seostata eksperimenti ainult puhas diskrimineerimine, vaid sisaldab ka elemente üldistused.
  • 2. Kui kontrollstiimul ergastab teatud hulga sensoorseid elemente, mis on täiesti erinevad nendest elementidest, mis aktiveerusid varem esitatud sama klassi stiimulite mõjul, siis on katse uurimus. puhas üldistus .

Pertseptronidel puudub puhta üldistusvõime, kuid nad toimivad diskrimineerimiskatsetes üsna rahuldavalt, eriti kui kontrollstiimul sobib piisavalt täpselt ühe kujutisega, millega pertseptronil on juba kogemusi.

Näiteid mustrituvastusprobleemidest

  • Kirja äratundmine.
  • Vöötkoodi tuvastamine.
  • Numbrimärgituvastus.
  • Näotuvastus.
  • Kõnetuvastus.
  • Pildituvastus.
  • Maakoore kohalike alade äratundmine, kus asuvad maavaramaardlad.

Mustri tuvastamise programmid

Vaata ka

Märkmed

Lingid

  • Juri Lifshits. Kursus “Teoreetilise arvutiteaduse kaasaegsed probleemid” - loengud mustrituvastuse statistilistest meetoditest, näotuvastusest, tekstide klassifitseerimisest
  • Mustri tuvastamise uuringute ajakiri

Kirjandus

  • David A. Forsythe, Jean Pons Arvutinägemine. Kaasaegne lähenemine = Computer Vision: A Modern Approach. - M.: "Williams", 2004. - Lk 928. - ISBN 0-13-085198-1
  • George Stockman, Linda Shapiro Arvutinägemine = Computer Vision. - M.: Binom. Teadmiste labor, 2006. - Lk 752. - ISBN 5947743841
  • A.L.Gorelik, V.A.Skripkin, Tunnustusmeetodid, M.: Kõrgkool, 1989.
  • Sh.-K. Cheng, Visuaalsete infosüsteemide kujundamise põhimõtted, M.: Mir, 1994.

Wikimedia sihtasutus. 2010. aasta.

Tehnoloogias on teaduslik ja tehniline suund, mis on seotud meetodite väljatöötamise ja süsteemide (sealhulgas arvutipõhiste) ehitamisega, et tuvastada teatud objekti (objekti, protsessi, nähtuse, olukorra, signaali) kuuluvus ühele edasiminekust. .. ... Suur entsüklopeediline sõnaraamat

Üks uutest piirkondadest küberneetika. R. o. teooria sisu. on mitmesse klassi kuuluvate objektide (kujutiste) omaduste ekstrapoleerimine neile mõnes mõttes lähedastele objektidele. Tavaliselt on automaadi R. o. saadaval...... Geoloogiline entsüklopeedia

Inglise äratundmine, kuvand; saksa keel Gestalt alterkennung. Matemaatilise küberneetika haru, mis töötab välja põhimõtted ja meetodid objektide klassifitseerimiseks ja identifitseerimiseks, mida kirjeldatakse piiratud hulga neid iseloomustavate tunnuste abil. Antinazi. Entsüklopeedia...... Sotsioloogia entsüklopeedia

Mustri äratundmine- meetod keerukate objektide uurimiseks arvuti abil; seisneb funktsioonide valimises ning algoritmide ja programmide väljatöötamises, mis võimaldavad arvutitel nende funktsioonide alusel objekte automaatselt klassifitseerida. Näiteks määrake, milline ... ... Majandus- ja matemaatikasõnastik

- (tehniline), teaduslik ja tehniline suund, mis on seotud meetodite väljatöötamise ja süsteemide (sealhulgas arvutipõhiste) väljatöötamisega, et tuvastada teatud objekti (objekti, protsessi, nähtuse, olukorra, signaali) kuuluvus ühte edusammudest. ... ... entsüklopeediline sõnaraamat

MUSTRI TUNNISTAMINE- matemaatilise küberneetika osa, mis arendab klassifitseerimismeetodeid, samuti objektide, nähtuste, protsesside, signaalide, kõigi nende objektide olukordade tuvastamist, mida saab kirjeldada teatud märkide või omaduste lõpliku hulgaga,... ... Vene sotsioloogiline entsüklopeedia

mustrituvastus- 160 mustrituvastus: esitusvormide ja konfiguratsioonide tuvastamine automaatsete vahenditega

Kujutise all mõistetakse uuritava objekti või nähtuse struktureeritud kirjeldust, mida kujutab tunnuste vektor, mille iga element kujutab ühe vastavat objekti iseloomustava tunnuse arvväärtust.

Tunnustussüsteemi üldine struktuur on järgmine:

Tuvastamisülesande eesmärk on tuvastada, kas uuritavatel objektidel on kindel lõplik tunnuste hulk, mis võimaldab neid teatud klassi liigitada. Tuvastamisülesannetel on järgmised iseloomulikud tunnused:

1. Need on teabeülesanded, mis koosnevad kahest etapist.

a. Lähteandmete taandamine äratundmiseks mugavaks vormiks.

b. Äratundmine ise näitab, et objekt kuulub teatud klassi.

2. Nendes ülesannetes saate tutvustada objektide analoogia või sarnasuse mõistet ja sõnastada objektide läheduse mõiste, mis on aluseks objektide liigitamisel samasse klassi või erinevatesse klassidesse.

3. Nendes ülesannetes saab opereerida pretsedentide kogumiga - näidetega, mille klassifikatsioon on teada ja mida saab formaliseeritud kirjelduste kujul esitada tuvastusalgoritmile, et õppeprotsessi käigus ülesandega kohaneda.

4. Nende probleemide lahendamiseks on keeruline koostada formaalseid teooriaid ja rakendada klassikalisi matemaatilisi meetodeid: sageli pole täpse matemaatilise mudeli jaoks saadav teave või mudeli ja matemaatiliste meetodite kasutamisest saadav kasu kuludega proportsionaalne.

5. Nende ülesannete puhul on võimalik “halb informatsioon” – info väljajätmisega, heterogeenne, kaudne, hägune, mitmetähenduslik, tõenäosuslik.

Soovitatav on eristada järgmist tüüpi tuvastamisülesandeid:

1. Tuvastamisülesanne ehk esitletava objekti määramine selle kirjelduse järgi ühte etteantud klassidest (juhendatud õpe).

2. Automaatse klassifitseerimise ülesandeks on objektide (olukordade) hulga jagamine nende kirjelduste järgi mittekattuvate klasside süsteemiks (taksonoomia, klasteranalüüs, juhendamata õpe).

3. Ülesanne valida äratundmisel informatiivne tunnuste kogum.

4. Ülesanne taandada lähteandmed äratundmiseks mugavale vormile.

5. Dünaamiline tuvastamine ja dünaamiline klassifitseerimine – ülesanded 1 ja 2 dünaamiliste objektide jaoks.

6. Prognoosimisprobleem - probleemid 5, mille puhul otsus peab olema seotud mingi hetkega tulevikus.

Kujutise mõiste.

Pilt, klass on klassifikatsioonirühmitus süsteemis, mis ühendab (valib) teatud objektide rühma teatud kriteeriumi järgi. Piltidel on mitmeid iseloomulikke omadusi, mis väljenduvad selles, et samast komplektist piiratud arvu nähtustega tutvumine võimaldab ära tunda meelevaldselt suure hulga selle esindajaid.


Kujutisena võib käsitleda ka teatud juhtobjekti olekute kogumit ja kogu seda olekute kogumit iseloomustab see, et etteantud eesmärgi saavutamiseks on vaja sama mõju objektile. Piltidel on iseloomulikud objektiivsed omadused selles mõttes, et erinevad inimesed, kes on saanud erineva vaatlusmaterjali järgi, klassifitseerivad samu objekte enamasti ühtemoodi ja üksteisest sõltumatult.

Üldiselt koosneb mustrituvastuse probleem kahest osast: koolitusest ja äratundmisest.

Treening viiakse läbi üksikute objektide näitamisega, mis näitab nende kuuluvust ühe või teise pildi juurde. Koolituse tulemusena peab äratundmissüsteem omandama oskuse reageerida samade reaktsioonidega kõikidele sama pildi objektidele ja erinevate reaktsioonidega kõikidele erineva kujutisega objektidele.

On väga oluline, et õppeprotsess lõppeks ainult piiratud arvu objektide näitamisega ilma muude viipadeta. Õppimisobjektid võivad olla nii visuaalsed kujutised, mitmesugused välismaailma nähtused ja muud.

Koolitusele järgneb uute objektide äratundmise protsess, mis iseloomustab juba treenitud süsteemi tegevust. Nende protseduuride automatiseerimine on mustrite tuvastamise õpetamise probleem. Juhul, kui inimene ise lahendab või leiutab ja seejärel arvutile klassifitseerimisreeglid kehtestab, lahendatakse äratundmisprobleem osaliselt, kuna inimene võtab enda peale probleemi põhi- ja põhiosa (koolituse).

Mustrituvastuse õpetamise probleem on huvitav nii rakenduslikust kui ka fundamentaalsest vaatenurgast. Rakenduslikust vaatenurgast on selle probleemi lahendamine oluline eelkõige seetõttu, et see avab võimaluse automatiseerida paljusid protsesse, mida seni on seostatud vaid elava aju tegevusega. Probleemi põhimõtteline tähtsus on seotud küsimusega, mida arvuti põhimõtteliselt suudab ja mida mitte.

Juhtimisprobleemide lahendamisel mustrituvastusmeetodite abil kasutatakse mõiste „kujutis“ asemel mõistet „olek“. Olek – vaadeldava objekti mõõdetud voolu (hetk) karakteristikute kuvamise teatud vormid, olekute kogum määrab olukorra.

Tavaliselt nimetatakse olukorda keerulise objekti teatud olekute kogumiks, millest igaüht iseloomustavad objekti samad või sarnased omadused. Näiteks kui teatud juhtimisobjekti käsitletakse vaatlusobjektina, siis ühendab olukord selle objekti sellised olekud, milles tuleks rakendada samu juhtimistoiminguid. Kui vaatlusobjektiks on mäng, siis ühendab olukord kõiki mänguseisundeid.

Objektide esmase kirjelduse valik on mustrituvastuse õppimise probleemi üks keskseid ülesandeid. Kui esialgne kirjeldus (tunnuse ruum) on edukalt valitud, võib äratundmisülesanne osutuda triviaalseks. Ja vastupidi, halvasti valitud esialgne kirjeldus võib kaasa tuua kas väga keerulise teabe edasise töötlemise või lahenduse puudumise.

Geomeetrilised ja struktuurilised lähenemised.

Iga pilti, mis tekib treeningu või eksami ajal objekti vaatlemise tulemusena, saab esitada vektorina ja seega punktina mõnes tunnusruumis.

Kui väidetakse, et piltide näitamisel on võimalik neid üheselt kahest (või mitmest) pildist omistada, siis väidetakse sellega, et mingis ruumis on kaks või enam piirkonda, millel ei ole ühiseid punkte ja et punkti kujutis on nendest piirkondadest. Igale sellise ala punktile saab anda nime ehk anda pildile vastava nime.

Tõlgendagem mustrituvastuse õppimise protsessi geomeetrilise pildi kaudu, piirdudes praegu vaid kahe kujutise äratundmise juhtumiga. Eeldatakse, et ette on teada vaid see, et mingis ruumis on vaja eraldada kaks piirkonda ja näidatakse ainult nendest piirkondadest pärit punkte. Need alad ise ei ole ette määratud, see tähendab, et puudub teave nende piiride asukoha kohta ega reeglid, mis määraksid, kas punkt kuulub konkreetsesse piirkonda.

Koolituse käigus esitatakse nendest aladest juhuslikult valitud punktid ning antakse infot, millisesse alasse esitatavad punktid kuuluvad. Täiendavat infot nende alade ehk nende piiride asukoha kohta koolitusel ei anta.

Treeningu eesmärk on kas konstrueerida pind, mis eraldaks mitte ainult treeningprotsessi käigus näidatud punktid, vaid ka kõik muud nendesse aladesse kuuluvad punktid, või konstrueerida neid alasid piiravad pinnad nii, et igaüks neist sisaldab ainult üks pilt. Teisisõnu, koolituse eesmärk on konstrueerida kujutise vektoritest funktsioone, mis oleksid näiteks ühe pildi kõigis punktides positiivsed ja teise kujutise kõigis punktides negatiivsed.

Kuna aladel puuduvad ühised punktid, on selliseid eraldavaid funktsioone alati terve hulk ja treeningu tulemusel tuleb üks neist konstrueerida. Kui esitatavad pildid ei kuulu kahele, vaid suuremale hulgale piltidele, siis on ülesandeks konstrueerida treeningul näidatud punktide abil pind, mis eraldab üksteisest kõik nendele piltidele vastavad alad.

Selle probleemi saab lahendada näiteks konstrueerides funktsiooni, mis võtab iga piirkonna punktide üle sama väärtuse ja erinevatest piirkondadest pärit punktide üle, peab selle funktsiooni väärtus olema erinev.

Võib tunduda, et vaid mõne punkti teadmisest piirkonnast ei piisa kogu ala isoleerimiseks. Tõepoolest, on võimalik märkida lõpmatu arv erinevaid alasid, mis sisaldavad neid punkte ja olenemata sellest, kuidas pind on nendest konstrueeritud, tuues esile ala, on alati võimalik näidata mõnda teist pinda lõikavat ala ja samal ajal sisaldab näidatud punkte.

Siiski on teada, et funktsiooni lähendamise probleem seda puudutava teabe põhjal piiratud punktide kogumis on oluliselt kitsam kui kogu hulk, millel funktsioon on antud, ja see on funktsioonide lähendamise tavaline matemaatiline probleem. Loomulikult eeldab selliste probleemide lahendamine teatud piirangute kehtestamist vaadeldavale funktsioonide klassile ning nende piirangute valik sõltub sellest, millist teavet õpetaja saab õppeprotsessi lisada.

Üks selline vihje on piltide kompaktsuse hüpotees.

Koos mustrituvastuse õpetamise probleemi geomeetrilise tõlgendamisega on veel üks lähenemine, mida nimetatakse struktuurseks või keeleliseks. Vaatleme lingvistilist lähenemist visuaalse pildituvastuse näitel.

Esiteks tehakse kindlaks algmõistete kogum - pildil leitud tüüpilised fragmendid ja fragmentide suhtelise asukoha omadused (vasakul, all, sees jne). Need algmõisted moodustavad sõnavara, mis võimaldab konstrueerida erinevaid loogilisi väiteid, mida mõnikord nimetatakse lauseteks.

Ülesandeks on valida suure hulga väidete hulgast, mida saaks nende mõistete abil konstrueerida, konkreetse juhtumi jaoks kõige olulisemad. Järgmiseks, vaadates igalt pildilt piiratud ja võib-olla väikest arvu objekte, peate koostama nende piltide kirjelduse.

Konstrueeritud kirjeldused peavad olema nii täielikud, et lahendataks küsimus, millise kujutise alla antud objekt kuulub. Lingvistilise lähenemise rakendamisel kerkib esile kaks ülesannet: algsõnastiku ehk tüüpiliste fragmentide komplekti koostamine ja antud sõnastiku elementidest kirjeldusreeglite konstrueerimine.

Keelelise tõlgenduse raames tõmmatakse analoogia kujundite struktuuri ja keele süntaksi vahel. Soovi selle analoogia järele tingis võimalus kasutada matemaatilise lingvistika aparatuuri ehk meetodid on oma olemuselt süntaktilist laadi. Matemaatilise lingvistika aparaadi kasutamist piltide struktuuri kirjeldamiseks saab kasutada alles pärast seda, kui kujutised on segmenteeritud osadeks, st on välja töötatud sõnad tüüpiliste fragmentide kirjeldamiseks ja nende otsimise meetodid.

Sõnavaliku tagamise eeltöö järel tekivad tegelikud keelelised ülesanded, mis koosnevad kirjelduste automaatse grammatilise parsimise ülesannetest kujutise tuvastamiseks.

Kompaktsuse hüpotees.

Kui eeldada, et õppeprotsessi käigus kujuneb tunnusruum lähtuvalt kavandatud klassifikatsioonist, siis võib loota, et tunnusruumi spetsifikatsioon ise määrab omaduse, mille mõjul on selles ruumis olevad kujutised kergesti eraldatavad. Just need lootused, kui töö mustrituvastuse valdkonnas arenes, ajendasid kompaktsuse hüpoteesi esilekerkimist, mis väidab, et kujutised vastavad funktsiooniruumis kompaktsetele komplektidele.

Kompaktse hulga all peame silmas teatud punktide klastreid pildiruumis, eeldades, et nende klastrite vahel on neid eraldavad haruldused. Seda hüpoteesi ei saanud aga alati eksperimentaalselt kinnitada. Kuid need ülesanded, mille kompaktsuse hüpotees oli hästi täidetud, leidsid alati lihtsa lahenduse ja vastupidi, need ülesanded, mille puhul hüpotees kinnitust ei leidnud, jäid kas üldse lahendamata või lahendati suure raskusega ja lisainfo kaasamisega.

Kompaktsuse hüpotees ise on saanud märgiks äratundmisprobleemide rahuldava lahendamise võimalikkusest.

Kompaktsuse hüpoteesi sõnastamine viib meid abstraktse pildi mõistele lähedale. Kui ruumi koordinaadid on valitud juhuslikult, jaotuvad selles olevad pildid juhuslikult. Need asuvad ruumi mõnes osas tihedamalt kui teistes.

Nimetagem mõnda juhuslikult valitud ruumi abstraktseks pildiks. Selles abstraktses ruumis on peaaegu kindlasti olemas kompaktsed punktide komplektid. Seetõttu nimetatakse kompaktsuse hüpoteesi kohaselt objektide kogumit, millele abstraktses ruumis vastavad kompaktsed punktide komplektid, tavaliselt antud ruumi abstraktseteks kujutisteks.

Treening ja iseõppimine, kohanemine ja koolitus.

Kui oleks võimalik märgata teatud universaalset omadust, mis ei sõltu ei kujutiste olemusest ega nende kujutistest, vaid määrab ainult eraldumise võime, siis koos tavapärase ülesandega õppida äratundmist, kasutades teavet nende kuuluvuse kohta. objekti koolitusjärjestusest ühele või teisele kujutisele, on võimalik Võimalik oleks püstitada teistsugune klassifitseerimisprobleem - nn juhendamata õppimisprobleem.

Seda laadi ülesannet kirjeldaval tasandil saab sõnastada järgmiselt: süsteem esitatakse samaaegselt või järjestikku objektidega, ilma et oleks viidatud nende kuuluvusele kujutistesse. Süsteemi sisendseade kaardistab objektide komplekti kujutiste kogumile ja, kasutades eelnevalt mõnda sellele omast kujutise eraldatavuse omadust, loob nende objektide sõltumatu klassifikatsiooni.

Pärast sellist iseõppimise protsessi peaks süsteem omandama võime ära tunda mitte ainult juba tuttavaid objekte (objekte koolitusjärjestusest), vaid ka neid, mida varem ei esitatud. Teatud süsteemi iseõppimise protsess on protsess, mille tulemusena omandab see süsteem ilma õpetaja korralduseta võime arendada identseid reaktsioone sama kujutisega objektide kujutistele ja erinevaid reaktsioone erinevate kujutiste kujutistele. .

Õpetaja roll on sel juhul ainult soovitada süsteemile mingit objektiivset omadust, mis on kõikide piltide puhul sama ja määrab võime jagada palju objekte kujutisteks.

Selgub, et selline objektiivne omadus on piltide kompaktsuse omadus. Punktide suhteline asukoht valitud ruumis sisaldab juba teavet selle kohta, kuidas punktide kogumit tuleks jagada. See teave määrab pildi eraldatavuse omaduse, mis on piisav, et süsteem saaks ise pildituvastust õppida.

Enamik tuntud iseõppivaid algoritme on võimelised tuvastama ainult abstraktseid pilte, st kompaktseid komplekte antud ruumides. Nende erinevus seisneb kompaktsuse mõiste vormistamises. See aga ei vähenda, mõnikord isegi suurendab iseõppivate algoritmide väärtust, kuna sageli ei ole pilte ise keegi eelnevalt määratlenud ning ülesandeks on kindlaks teha, millised kujutiste alamhulgad antud ruumis kujutavad pilte.

Sellise probleemipüstituse näiteks on sotsioloogiline uurimus, kui inimeste rühmad tuvastatakse küsimuste kogumi põhjal. Probleemi sellisel mõistmisel genereerivad iseõppivad algoritmid varem tundmatut teavet piltide olemasolu kohta antud ruumis, millest kellelgi varem aimugi polnud.

Lisaks iseloomustab iseõppimise tulemus valitud ruumi sobivust konkreetse tunnustamise õppeülesande täitmiseks. Kui iseõppimisruumis tuvastatud abstraktsed kujundid kattuvad reaalsetega, siis on ruum hästi valitud. Mida abstraktsemad pildid reaalsetest erinevad, seda ebamugavam on valitud ruum konkreetse ülesande jaoks.

Õppimist nimetatakse tavaliselt protsessiks, kus teatud süsteemis arendatakse välja üks või teine ​​reaktsioon väliste identsete signaalide rühmadele korduva kokkupuute kaudu väliste kohanduste süsteemiga. Selle kohanduse genereerimise mehhanism määrab peaaegu täielikult õppimisalgoritmi.

Iseõppimine erineb koolitusest selle poolest, et siin ei anta lisateavet süsteemile reageerimise õigsuse kohta.

Kohanemine on süsteemi parameetrite ja struktuuri ning võimalusel ka juhtimistoimingute muutmise protsess, mis põhineb jooksval teabel, et saavutada süsteemi teatud olek esialgse ebakindluse ja muutuvate töötingimuste korral.

Õppimine on protsess, mille tulemusena süsteem omandab järk-järgult võime reageerida vajalike reaktsioonidega teatud kogumitele välismõjudele ning kohanemine on süsteemi parameetrite ja struktuuri kohandamine eesmärgiga saavutada vajalik kontrolli kvaliteet. välistingimuste pidevate muutuste taustal.


Kõnetuvastussüsteemid.

Kõne toimib inimestevahelise suhtluse peamise vahendina ja seetõttu peetakse verbaalset suhtlust tehisintellektisüsteemi üheks olulisemaks komponendiks. Kõnetuvastus on protsess, mille käigus muundatakse mikrofoni või telefoni väljundis genereeritud akustiline signaal sõnade jadaks.

Keerulisem ülesanne on kõne mõistmine, mis hõlmab akustilise signaali tähenduse tuvastamist. Sel juhul toimib kõnetuvastuse alamsüsteemi väljund lausungi mõistmise alamsüsteemi sisendina. Automaatne kõnetuvastus (ARR-süsteemid) on loomuliku keele töötlemise tehnoloogiate üks valdkondi.

Automaatset kõnetuvastust kasutatakse teksti sisestamise automatiseerimiseks arvutisse, andmebaasidesse või teabeotsingusüsteemidesse suuliste päringute genereerimisel, verbaalsete käskude genereerimisel erinevatele intelligentsetele seadmetele.

Kõnetuvastussüsteemide põhimõisted.

Kõnetuvastussüsteeme iseloomustavad paljud parameetrid.

Üks peamisi parameetreid on sõnatuvastusviga (WRO). See parameeter on tundmatute sõnade arvu ja öeldud sõnade koguarvu suhe.

Muud automaatseid kõnetuvastussüsteeme iseloomustavad parameetrid on järgmised:

1) sõnastiku suurus,

2) kõnerežiim,

3) kõnestiil,

4) ainevaldkond,

5) kõnelejasõltuvus,

6) akustilise müra tase,

7) sisendkanali kvaliteet.

Sõltuvalt sõnastiku suurusest jagunevad APP-süsteemid kolme rühma:

Väikese sõnastikuga (kuni 100 sõna),

Keskmise sõnavara suurusega (100 sõnast mitme tuhande sõnani)

Suure sõnastikuga (üle 10 000 sõna).

Kõnerežiim iseloomustab sõnade ja fraaside hääldamist. On olemas süsteemid pideva kõne äratundmiseks ja süsteemid, mis võimaldavad ära tunda ainult üksikuid kõnesõnu. Eraldatud sõnatuvastusrežiim nõuab, et kõneleja teeks sõnade vahel lühikese pausi.

Kõnestiili järgi jagunevad APP süsteemid kahte rühma: deterministlikud kõnesüsteemid ja spontaansed kõnesüsteemid.

Deterministlikes kõnetuvastussüsteemides taasesitab kõneleja kõnet järgides keele grammatilisi reegleid. Spontaanset kõnet iseloomustavad grammatikareeglite rikkumised ja seda on raskem ära tunda.

Sõltuvalt ainevaldkonnast eristatakse APP-süsteeme, mis on keskendunud rakendusele väga spetsiifilistes valdkondades (näiteks juurdepääs andmebaasidele) ja piiramatu rakendusalaga APP-süsteeme. Viimased nõuavad suurt sõnavara ja peavad võimaldama spontaanse kõne äratundmist.

Paljud automaatsed kõnetuvastussüsteemid sõltuvad kõnelejast. See hõlmab süsteemi eelhäälestamist konkreetse kõneleja hääldusfunktsioonide järgi.

Kõnetuvastuse probleemi lahendamise keerukus on seletatav akustiliste signaalide suure varieeruvusega. See kõikumine on tingitud mitmest põhjusest:

Esiteks foneemide - keele helistruktuuri põhiüksuste - erineva teostuse kaudu. Foneemide rakendamise varieeruvus on tingitud naaberhäälikute mõjust kõnevoos. Helikeskkonna poolt määratud foneemiteostuse varjundeid nimetatakse allofonideks.

Teiseks akustiliste vastuvõtjate asukoht ja omadused.

Kolmandaks sama kõneleja kõneparameetrite muutused, mis on tingitud kõneleja erinevast emotsionaalsest seisundist ja tema kõne tempost.

Joonisel on kujutatud kõnetuvastussüsteemi põhikomponendid:

Digiteeritud kõnesignaal saadetakse eeltöötlusseadmesse, kus eraldatakse helituvastuseks vajalikud omadused. Helituvastus tehakse sageli tehisnärvivõrgu mudelite abil. Valitud heliühikuid kasutatakse seejärel sõnade jada otsimiseks, mis vastavad kõige paremini sisendkõnesignaalile.

Sõnajada otsimine toimub akustiliste, leksikaalsete ja keelemudelite abil. Mudeli parameetrid määratakse sobivate õppealgoritmide põhjal koolitusandmete põhjal.

Kõnesüntees tekstist. Põhimõisted

Enesekommunikatsiooni elementidega tehisintellektisüsteemide loomine nõuab paljudel juhtudel sõnumite väljastamist kõne kujul. Joonisel on kujutatud kõneliidesega intelligentse küsimuste-vastuste süsteemi plokkskeem:

Pilt 1.

Võtke Olegilt osa loengust

Vaatleme kõneosa tuvastamise näitel empiirilise lähenemise tunnuseid. Ülesanne on määrata lause sõnadele sildid: nimisõna, tegusõna, eessõna, omadussõna jms. Lisaks on vaja kindlaks määrata mõned nimisõnade ja tegusõnade lisatunnused. Näiteks nimisõna jaoks - arv ja tegusõna jaoks - vorm. Vormistame probleemi.

Kujutagem ette lauset sõnade jadana: W=w1 w2…wn, kus wn on juhuslikud muutujad, millest igaüks saab ühe võimaliku keelesõnaraamatusse kuuluva väärtuse. Lause sõnadele omistatud siltide jada saab esitada jadaga X=x1 x2 ... xn, kus xn on juhuslikud muutujad, mille väärtused määratakse võimalike siltide hulgast.

Seejärel on kõneosatuvastuse ülesandeks leida antud sõnade w1, w2, ..., wn jadast kõige tõenäolisem siltide jada x1, x2, ..., xn. Teisisõnu on vaja leida siltide jada X*=x1 x2 … xn, mis annab maksimaalse tingimusliku tõenäosuse P(x1, x2, …, xn| w1 w2.. wn).

Kirjutame tingimusliku tõenäosuse P(X| W) ümber järgmisel kujul P(X| W)=P(X,W) / P(W). Kuna muutuja X jaoks on vaja leida tingimusliku tõenäosuse P(X,W) maksimum, saame X*=arg x max P(X,W). Ühistõenäosuse P(X,W) saab kirjutada tingimuslike tõenäosuste korrutisena: P(X,W) = u-1 korrutis n väärtusest P(x i |x1,…,x i -1 , w1,…, wi -1 ) P(w i |x1,…,x i -1, w1,…,w i -1). Antud avaldise maksimumi otsene otsimine on keeruline ülesanne, kuna n suurte väärtuste korral muutub otsinguruum väga suureks. Seetõttu on selles korrutises kirjas olevad tõenäosused lähendatud lihtsamate tingimuslike tõenäosustega: P(x i |x i -1) P(w i |w i -1). Sel juhul eeldatakse, et sildi x i väärtus on seotud ainult eelmise sildiga x i -1 ja ei sõltu varasematest siltidest, samuti, et sõna w i tõenäosuse määrab ainult praegune silt x i . Neid eeldusi nimetatakse Markovi eeldusteks ja ülesande lahendamiseks kasutatakse Markovi mudelite teooriat. Võttes arvesse Markovi eeldusi, võime kirjutada:

X*= arg x1, …, xn max P i =1 n P(x i |x i -1) P(wi|wi-1)

Kui tingimuslikke tõenäosusi hinnatakse treeningandmete kogumi põhjal

Siltide jada X* otsimine toimub Viterbi dünaamilise programmeerimisalgoritmi abil. Viterbi algoritmi võib käsitleda otsingualgoritmi variandina olekugraafikul, kus tipud vastavad sõnamärgistele.

On iseloomulik, et iga voolutipu jaoks on alamsiltide hulk alati sama. Veelgi enam, iga alamtipu puhul langevad kokku ka vanemtippude hulgad. Seda seletatakse asjaoluga, et üleminekud viiakse läbi olekugraafikul, võttes arvesse kõiki võimalikke siltide kombinatsioone. Markovi eeldused lihtsustavad oluliselt kõneosade äratundmise probleemi, säilitades samas sõnadele siltide määramise suure täpsuse.

Seega on 200 sildi puhul määramise täpsus ligikaudu 97%. Pikka aega viidi imperialanalüüs läbi stohhastiliste kontekstivabade grammatikate abil. Siiski on neil märkimisväärne puudus. See seisneb selles, et erinevatele grammatilistele parsidele saab määrata samad tõenäosused. See juhtub seetõttu, et sõelumise tõenäosus on esitatud sõelumisega seotud reeglite tõenäosuste korrutisega. Kui analüüsi käigus kasutatakse erinevaid reegleid, mida iseloomustavad samad tõenäosused, siis sellest tuleneb näidatud probleem. Parima tulemuse annab grammatika, mis võtab arvesse keele sõnavara.

Sel juhul sisaldavad reeglid vajalikku leksikaalset teavet, mis annab sama reegli jaoks erinevates leksikaalsetes keskkondades erinevaid tõenäosusväärtusi. Imperial parsimine sarnaneb rohkem mustrituvastusega kui traditsioonilisele parsimisele selle klassikalises tähenduses.

Võrdlevad uuringud on näidanud, et loomuliku keele rakendustes on imperial parsimise täpsus suurem kui traditsioonilisel parsimisel.

Automaatse pildituvastuse meetodid ja nende rakendamine optilistes märgituvastussüsteemides (OCR-süsteemides) on üks arenenumaid tehisintellekti tehnoloogiaid. Venemaa teadlased on selle tehnoloogia arendamisel maailmas juhtival kohal.

OCR-süsteemi all mõistetakse süsteemi automaatseks mustrituvastuseks, kasutades spetsiaalseid programme trükitud või käsitsi kirjutatud tekstimärkide kujutiste jaoks (näiteks skanneri kaudu arvutisse sisestatud) ja teisendades selle vormingusse, mis sobib töötlemiseks tekstitöötlusprogrammide, tekstiredaktorite abil. , jne.

Lühend OCR tähistab mõnikord Optical Character Reader - seadet optiliseks märgituvastuseks või automaatseks teksti lugemiseks. Praegu töötlevad sellised tööstuslikus kasutuses olevad seadmed päevas kuni 100 tuhat dokumenti.

Tööstuslik kasutamine hõlmab hea ja keskmise kvaliteediga dokumentide sisestamist - see on loendusvormide, maksudeklaratsioonide jms töötlemine.

Loetleme teemavaldkonna tunnused, mis on OCR-süsteemide seisukohast olulised:

  • erinevate sümbolite font ja suurus;
  • moonutused sümbolikujutistes (katkestused sümbolikujutistes);
  • moonutused skaneerimise ajal;
  • võõrkehad piltidel;
  • tekstikatkendite kombineerimine erinevates keeltes;
  • lai valik märgiklasse, mida saab ära tunda ainult täiendava kontekstuaalse teabe abil.

Trükitud ja käsitsi kirjutatud tekstide automaatne lugemine on keerukate piltide automaatse visuaalse tajumise erijuht. Arvukad uuringud on näidanud, et selle probleemi täielikuks lahendamiseks on vajalik intellektuaalne äratundmine, st "arusaamine".

Kõik OCR-süsteemid põhinevad kolmel põhimõttel.

  • 1. Pildi terviklikkuse põhimõte. Uuritaval objektil on alati olulisi osi, mille vahel on seos. Pildi osadega lokaalsete operatsioonide tulemusi tõlgendatakse terviklike fragmentide ja kogu pildi kui terviku tõlgendamise protsessis ainult koos.
  • 2. Sihipärasuse põhimõte. Äratundmine on hüpoteeside püstitamise ja kontrollimise eesmärgipärane protsess (objektilt oodatava leidmine).
  • 3. Kohanemisvõime põhimõte. Tunnustussüsteem peab olema iseõppimisvõimeline.

Juhtivad Venemaa OCR-süsteemid: FineReader; FineReaderi käsikiri; FormReader; CunieForm (kognitiivsed tehnoloogiad), kognitiivsed vormid (kognitiivsed tehnoloogiad) .

FineReaderi süsteemi toodab ABBYY, mis asutati 1989. aastal. ABBYY arendustegevus toimub kahes suunas: arvutinägemine ja rakenduslingvistika. Teadus- ja arendustegevuse strateegiline suund on arvutinägemise, tehisintellekti ja rakenduslingvistika valdkonna tehnoloogiate loomulik keeleaspekt.

CuneiForm GOLD for Windows on maailma esimene iseõppiv intelligentne OCR-süsteem, mis kasutab uusimat adaptiivset tekstituvastustehnoloogiat ja toetab mitut keelt. Iga keele jaoks on kaasas sõnastik konteksti kontrollimiseks ja tuvastustulemuste kvaliteedi parandamiseks. Tunneb ära kõik trükitud, trükitud kirjatüübid ja printeritelt saadud fondid, välja arvatud dekoratiivsed ja käsitsi kirjutatud, samuti väga madala kvaliteediga tekstid.

Mustrituvastussüsteemide omadused. OCPL-tehnoloogiate hulgas on teatud tüüpi automaatse mustrituvastuse probleemide lahendamiseks väga olulised spetsiaalsed tehnoloogiad:

  • otsida inimesi fotode järgi;
  • maavarade leiukohtade otsimine ja ilmateade aerofotograafia ja satelliidipiltide põhjal erinevates valguskiirguse vahemikes;
  • geograafiliste kaartide koostamine eelmises ülesandes kasutatud lähteinfo põhjal;
  • sõrmejälgede ja vikerkesta mustrite analüüs kohtuekspertiisi, turva- ja meditsiinisüsteemides.

Teabe ettevalmistamise ja töötlemise etapis, eriti ettevõtte arvutistamise ja raamatupidamise automatiseerimise ajal, tekib ülesanne sisestada arvutisse suur hulk teksti- ja graafilist teavet. Peamised seadmed graafilise teabe sisestamiseks on: skanner, faksmodem ja harvem digikaamera. Lisaks saab optiliste tekstituvastusprogrammide abil ka tekstiinfot arvutisse sisestada (digiteerida). Kaasaegsed tarkvara- ja riistvarasüsteemid võimaldavad automatiseerida suurte infomahtude sisestamist arvutisse, kasutades näiteks võrguskannerit ja paralleelset tekstituvastust mitmel arvutil korraga.

Enamik OCR-programme töötab rasterpiltidega, mis võetakse vastu faksmodemi, skanneri, digikaamera või muu seadme kaudu. Esimeses etapis peab OSL-süsteem jagama lehe tekstiplokkideks, võttes aluseks parem- ja vasakpoolse joonduse ning mitme veeru olemasolu. Seejärel jagatakse tuvastatud plokk ridadeks. Vaatamata näilisele lihtsusele pole see nii ilmne ülesanne, kuna praktikas on lehe või selle fragmentide kujutise moonutamine voltimisel vältimatu. Isegi kerge kalde korral jääb ühe rea vasak serv madalamaks kui järgmise parem serv, eriti kitsa reavahe korral. Selle tulemusena tekib probleem selle joone kindlaksmääramisel, kuhu see või teine ​​pildifragment kuulub. Näiteks kirjade jaoks

Seejärel jagatakse jooned pidevateks pildialadeks, mis vastavad üksikutele tähtedele; Tuvastamisalgoritm teeb eeldusi nende alade vastavuse kohta tähemärkidele ja seejärel valitakse iga märk, mille tulemusena rekonstrueeritakse leht tekstimärkidena ja reeglina etteantud formaadis. OBL-süsteemid suudavad saavutada parima tuvastamise täpsuse – tavapärastest fontidest koosnevate puhaste piltide puhul üle 99,9%. Esmapilgul tundub selline tuvastustäpsus ideaalne, kuid veaprotsent on siiski masendav, sest kui lehel on orienteeruvalt 1500 tähemärki, siis isegi 99,9% tuvastamise õnnestumise protsent on üks-kaks viga ühel lehel. Sellistel juhtudel tuleks kasutada sõnastiku kontrollimise meetodit, st kui sõna pole süsteemi sõnastikus, siis proovib ta erireeglite järgi sarnast leida. Kuid see ei võimalda siiski 100% vigu parandada ja nõuab tulemuste inimlikku kontrolli.

Päriselust leitud tekstid pole tavaliselt kaugeltki täiuslikud ja “ebapuhaste” tekstide tuvastamisvigade protsent on sageli lubamatult kõrge. Määrdunud pildid on kõige ilmsem probleem, sest isegi väikesed plekid võivad varjata tegelase määratlevaid osi või muuta need teiseks. Teine probleem on ebatäpne skaneerimine, mis on tingitud "inimfaktorist", kuna skanneri juures istuv operaator lihtsalt ei suuda iga skannitud lehte siluda ja täpselt skanneri servadega joondada. Kui dokument on paljundatud, tekivad sageli katkestused ja märkide liitmised. Kõik need efektid võivad põhjustada süsteemis vigu, kuna mõned OS-süsteemid eeldavad, et külgnev pildiala peab koosnema ühest tähemärgist. Piiramatu või viltune leht tekitab kergelt moonutatud märgikujutisi, mida OS-süsteem võib segadusse ajada.

OS-i süsteemitarkvara töötab tavaliselt skannerilt saadud lehe suure bitmap kujutisega. Standardresolutsiooniga pildid saadakse skaneerimisega 9600 ppi. Selle eraldusvõimega A4-lehe kujutis võtab umbes 1 MB mälu.

OCR-süsteemide põhieesmärk on analüüsida rasterinformatsiooni (skaneeritud sümbol) ja määrata pildi fragmendile vastav sümbol. Pärast tuvastusprotsessi lõppu peavad OCR-süsteemid suutma säilitada algdokumentide vormingu, määrata õigesse kohta lõiguatribuudi, salvestada tabeleid, graafikat jms. Kaasaegsed tuvastusprogrammid toetavad kõiki teadaolevaid teksti-, graafika- ja tabelivorminguid. HTML- ja PDF-vormingus.

OCR-süsteemidega töötamine ei tohiks reeglina erilisi raskusi tekitada. Enamikul neist süsteemidest on lihtne automaatne skannimise ja lugemise režiim ning need toetavad ka režiimi failidest piltide tuvastamiseks. Siiski on antud süsteemi jaoks parimate võimalike tulemuste saavutamiseks soovitatav (ja sageli ka kohustuslik) see esmalt käsitsi seadistada teatud tüüpi teksti, vormipaigutuse ja paberikvaliteedi jaoks. Valesti joondatud või kaldus leht tekitab kergelt moonutatud märgikujutisi, mida OCR-süsteem võib segadusse ajada.

OCR-süsteemiga töötamisel on väga oluline valida tuvastuskeel ja tuvastatava materjali tüüp (kirjutusmasin, faks, maatriksprinter, ajaleht jne), samuti kasutajaliidese intuitiivne selgus. Mitut keelt kasutavate tekstide äratundmisel sõltub äratundmise efektiivsus OCR-süsteemi võimest moodustada keelerühmi. Samas on mõnel süsteemil juba enamkasutatavate keelte, näiteks vene ja inglise keele kombinatsioonid.

Hetkel on tohutult palju programme, mis ühe võimalusena toetavad tekstituvastust. Selle valdkonna liider on FineReaderi süsteem. Programmi uusimas versioonis (6.0) on nüüd tööriistad FineReader 6.0 tehnoloogial põhinevate uute süsteemide arendamiseks. FineReader 6.0 perekonda kuuluvad: FineReader 6.0 Professional, FineReader 6.0 Corporate Edition, FineReader Scripting Edition 6.0 ja FineReader Engine 6.0. Süsteemil FineReader 6.0 on lisaks suure hulga salvestamise vormingute, sealhulgas PDF-i tundmisele, võimalus PDF-faile otse ära tunda. Uus intelligentse taustafiltri tehnoloogia võimaldab filtreerida välja infot dokumendi tekstuuri ja pildi taustamüra kohta: mõnikord kasutatakse dokumendi teksti esiletõstmiseks halli või värvilist tausta. See ei takista inimesel lugemist, kuid tavapärased tekstituvastusalgoritmid kogevad sellise tausta peal asuvate tähtedega töötades tõsiseid raskusi. FineReader suudab tuvastada sarnast teksti sisaldavad alad, eraldades teksti dokumendi taustast, leides teatud suurusest väiksemad punktid ja eemaldades need. Sel juhul säilivad tähtede kontuurid, nii et nende kontuuride lähedal asuvad taustapunktid ei tekita häireid, mis võivad tekstituvastuse kvaliteeti halvendada.

Kasutades kaasaegsete küljendusprogrammide võimalusi, loovad disainerid sageli keeruka kujuga objekte, näiteks mähivad mitmeveerulise teksti ümber mitteristkülikukujulise pildi. FineReader 6.0 süsteem toetab selliste objektide tuvastamist ja nende salvestamist MS Wordi failidesse. Nüüd reprodutseeritakse selles tekstiredaktoris keeruka paigutusega dokumente täpselt. Isegi tabelid tuvastatakse maksimaalse täpsusega, säilitades samal ajal täielikud redigeerimisvõimalused.

Süsteem ABBYY FormReader on üks ABBYY tuvastusprogrammidest, mis põhineb ABBYY FineReader Engine süsteemil. See programm on loodud käsitsi täidetavate vormide tuvastamiseks ja töötlemiseks. ABBYY FormReader saab käsitleda nii fikseeritud paigutusega vorme kui ka vorme, mille struktuur võib muutuda. Tunnustamiseks kasutati uut ABBYY FlexiFormi tehnoloogiat.

Juhtivad tarkvaratootjad on oma toodetega kasutamiseks litsentsinud Venemaa infotehnoloogia. Populaarsetel tarkvarapakettidel Corel Draw (Corel Corporation), FaxLine/OCR & Business Card Wizard (Inzer Corporation) ja paljudel teistel on CuneiFormi OCR-teek sisse ehitatud. Sellest programmist sai esimene OCR-süsteem Venemaal, mis sai MS Windowsiga ühilduva logo.

Readiris Pro 7 süsteem on professionaalne tekstituvastusprogramm. Tootjate sõnul erineb see OCR-süsteem analoogidest tavaliste (igapäevaste) trükitud dokumentide, nagu kirjad, faksid, ajakirjade artiklid, ajaleheväljalõiked, muutmise kõrgeima täpsusega redigeerimiseks ligipääsetavateks objektideks (sh PDF-failid). Programmi peamised eelised on järgmised: võime enam-vähem täpselt ära tunda JPEG-vormingus meetodit kasutades "maksimaalselt" tihendatud pilte (maksimaalse kvaliteedikaotusega), digikaamerate tugi ja lehe orientatsiooni automaatne tuvastamine, üleslaadimise tugi. 92 keelde (sh vene keel).

OmniPage 11 süsteem on ScanSofti toode. Selle programmi piiratud versioon (OmniPage 11 Limited Edition, OmniPage Lite) on tavaliselt uute skanneritega kaasas (Euroopas ja USA-s). Arendajad väidavad, et nende programm tuvastab trükitud dokumendid peaaegu 100% täpsusega, taastades nende vormingu, sealhulgas veerud, tabelid, sidekriipsud (sh sõnaosade sidekriipsud), pealkirjad, peatükkide pealkirjad, allkirjad, leheküljenumbrid, joonealused märkused, lõigud, nummerdatud loendid , punased jooned, graafikud ja pildid. Võimalik on salvestada Microsoft Office, PDF ja 20 muus vormingus, tuvastada PDF-failidest ja redigeerida selles vormingus. Tehisintellekti süsteem võimaldab automaatselt tuvastada ja parandada vigu pärast esimest käsitsi korrigeerimist. Uus spetsiaalselt välja töötatud tarkvaramoodul “Dcspeckle” võimaldab tuvastada halvenenud kvaliteediga dokumente (faksid, koopiad, koopiate koopiad jne). Programmi eeliseks on võimalus ära tunda värvilist teksti ja teha häälega kohandusi. OmniPage'i versioon on olemas ka Macintoshi arvutite jaoks.

  • cm: Bashmakov A. I., Bashmakov I. A. Arukad infotehnoloogiad.

Saada oma head tööd teadmistebaasi on lihtne. Kasutage allolevat vormi

Üliõpilased, magistrandid, noored teadlased, kes kasutavad teadmistebaasi oma õpingutes ja töös, on teile väga tänulikud.

postitatud http://www.allbest.ru/

Vene Föderatsiooni haridus- ja teadusministeerium

Novosibirski Riiklik Majandus- ja Juhtimisülikool "NINKh"

Infotehnoloogia teaduskond

Rakenduslike infotehnoloogiate osakond

distsipliinis Hägusloogika ja närvivõrgud

Mustri äratundmine

Suund: Äriinformaatika (elektrooniline äri)

Õpilase täisnimi: Mazur Ekaterina Vitalievna

Kontrollis: Pavlova Anna Illarionovna

Novosibirsk 2016

  • Sissejuhatus
  • 1. Tunnustamise mõiste
    • 1.1 Arengu ajalugu
    • 1.2 Mustrituvastusmeetodite klassifikatsioon
  • 2. Mustri tuvastamise meetodid
  • 3. Mustrituvastusprobleemide üldtunnused ja nende liigid
  • 4. Mustrituvastuse arendamise probleemid ja väljavaated
    • 4.1 Mustrituvastuse rakendamine praktikas
  • Järeldus

Sissejuhatus

Päris pikka aega käsitleti mustrituvastuse probleemi ainult bioloogilisest vaatenurgast. Sel juhul täheldati ainult kvalitatiivseid omadusi, mis ei võimaldanud kirjeldada toimimismehhanismi.

N. Wieneri poolt 20. sajandi alguses kasutusele võetud mõiste küberneetika(teadus masinate, elusorganismide ja ühiskonna juhtimisprotsesside ja info edastamise üldistest seaduspäradest), võimaldas kasutusele võtta kvantitatiivseid meetodeid tunnustamise küsimustes. See tähendab, et kujutada seda protsessi (sisuliselt loodusnähtust) matemaatiliste meetodite abil.

Mustrituvastuse teooria on üks peamisi küberneetika harusid nii teoreetilises kui ka rakenduslikus mõttes. Seega hõlmab mõne protsessi automatiseerimine seadmete loomist, mis on võimelised reageerima väliskeskkonna muutuvatele omadustele teatud arvu positiivsete reaktsioonidega.

Selle taseme probleemide lahendamise aluseks on klassikalise statistiliste lahendusteooria tulemused. Selle raames ehitati algoritmid, et määrata klass, kuhu saab tuvastatud objekti klassifitseerida.

Käesoleva töö eesmärgiks on tutvuda mustrituvastuse teooria kontseptsioonidega: paljastada peamised definitsioonid, uurida selle esinemise ajalugu ning tuua välja teooria peamised meetodid ja põhimõtted.

Teema aktuaalsus seisneb selles, et hetkel on mustrituvastus küberneetika üks juhtivaid valdkondi. Seega on viimastel aastatel seda üha enam kasutatud: see lihtsustab inimese suhtlemist arvutiga ja loob eeldused erinevate tehisintellektisüsteemide kasutamiseks.

pildituvastusrakendus

1. Tunnustamise mõiste

Tunnustamise probleem köitis pikka aega vaid rakendusmatemaatika valdkonna teadlaste tähelepanu. Selle tulemusena ilmusid aastal loodud R. Fischeri teosed 20ndad, viis diskriminantanalüüsi kujunemiseni – mustrite tuvastamise teooria ja praktika ühe haruni. IN 40ndad A. N. Kolmogorov ja A. Ya. Khinchin seadsid eesmärgiks eraldada kahe jaotuse segu. Ja sisse 50-60ndad kahekümnendal sajandil ilmus suure hulga tööde põhjal statistiliste otsuste teooria. Küberneetika raames on hakanud tekkima uus suund, mis on seotud mehhanismide teoreetiliste aluste väljatöötamise ja praktilise rakendamisega, samuti objektide ja protsesside äratundmiseks loodud süsteemidega. Uut distsipliini nimetatakse "mustri äratundmiseks".

Mustri äratundmine(objektid) on ülesanne tuvastada objekt selle kujutise (optiline äratundmine), helisalvestuse (akustiline tuvastamine) või muude tunnuste järgi. Pilt on klassifikatsiooni rühmitus, mis võimaldab kombineerida objektide rühma teatud kriteeriumide järgi. Piltidel on iseloomulik tunnus, mis väljendub selles, et ühest komplektist piiratud arvu nähtustega tutvumine võimaldab ära tunda suure hulga selle esindajaid. Tunnustusprobleemi klassikalises sõnastuses on komplekt jagatud osadeks.

Üks põhimääratlusi on ka mõiste paljusid. Arvutis on komplekt sama tüüpi mittekorduvate elementide kogum. "Mittekorduv" tähendab, et element komplektis on olemas või mitte. Universaalne komplekt sisaldab kõiki võimalikke elemente, tühi komplekt ei sisalda ühtegi.

Tehnikat, kuidas mõnele pildile elemendi omistamine toimub, nimetatakse otsustav reegel. Teine oluline mõiste on mõõdikud- määrab komplekti elementide vahelise kauguse. Mida väiksem on see kaugus, seda sarnasemad on objektid (sümbolid, helid jne), mida me ära tunneme. Tavaliselt määratakse elemendid arvude kogumina ja mõõdik on määratud mingi funktsioonina. Programmi efektiivsus sõltub pildi esituse valikust ja meetrika teostusest: sama tuvastusalgoritm erinevate mõõdikutega teeb erineva sagedusega vigu.

Koolitus Tavaliselt nimetatakse protsessiks teatud süsteemis ühe või teise reaktsiooni väljatöötamine väliste sarnaste signaalide teguritele nende korduva mõju kaudu süsteemile. Iseseisev õppimine erineb koolitusest selle poolest, et siin ei anta süsteemile lisainfot reaktsiooni kohta.

Mustrituvastusülesannete näited on järgmised:

Kirjade äratundmine;

Vöötkoodituvastus;

Numbrimärgituvastus;

Nägude ja muude biomeetriliste andmete tuvastamine;

Kõnetuvastus jne.

1.1 Lugu arengut

50. aastate keskpaigaks seadis R. Penrose kahtluse alla aju närvivõrgu mudeli, osutades kvantmehaaniliste mõjude olulisele rollile selle toimimises. Selle põhjal töötas F. Rosenblatt välja visuaalse kujutise äratundmise õppimise mudeli, mida nimetatakse pertseptroniks.

Joonistamine1 - Perceptroni ahel

Edasi leiutati erinevaid pertseptroni üldistusi ning neuronite funktsioon oli keeruline: neuronid ei saanud mitte ainult sisendnumbreid korrutada ja tulemust läviväärtustega võrrelda, vaid rakendada neile ka keerulisemaid funktsioone. Joonis 2 näitab ühte sellist komplikatsiooni:

Riis. 2 Närvivõrgu skeem.

Lisaks võib närvivõrgu topoloogia olla veelgi keerulisem. Näiteks nii:

Joonis 3 – Rosenblatti närvivõrgu skeem.

Närvivõrgud, mis on matemaatilise analüüsi keeruline objekt, võimaldasid õigel kasutamisel leida väga lihtsaid andmeseadusi. Kuid see eelis on ka võimalike vigade allikas. Analüüsi keerukust seletab üldiselt ainult keeruline struktuur, kuid sellest tulenevalt praktiliselt ammendamatud võimalused väga erinevate mustrite üldistamiseks.

1.2 Klassifikatsioonmeetodidtunnustustpilte

Nagu me juba märkisime, viitab mustrituvastus ülesandele luua samaväärsussuhted objektide teatud kujutiste mudelite vahel reaalses või ideaalses maailmas.

Need seosed määravad ära tunnustatud objektide kuulumise mis tahes klassidesse, mida peetakse iseseisvateks üksusteks.

Tuvastamisalgoritmide koostamisel saab neid klasse täpsustada uurija, kes kasutab oma ideid või kasutab antud ülesande kontekstis lisainfot objektide sarnasuse või erinevuse kohta. Sel juhul räägime "tunnustamisest koos õpetajaga". Teises, s.o. Kui automatiseeritud süsteem lahendab klassifitseerimisprobleemi ilma täiendavat teavet kaasamata, räägivad nad "järelevalveta tuvastamisest".

Töödes V.A. Duke annab akadeemilise ülevaate tunnustamismeetoditest ja kasutab teadmiste esitamiseks kahte peamist viisi:

Intensionaalne (atribuutide vaheliste seoste diagrammi kujul);

Laiendus, kasutades konkreetseid fakte (objektid, näited).

Intensionaalne esitus kajastab mustreid, mis selgitavad andmete struktuuri. Seoses diagnostiliste probleemidega seisneb selline fikseerimine soovitud tulemuseni viivate objektide omadustega seotud toimingute määramises. Intensionaalseid esitusi rakendatakse väärtustega seotud toimingute kaudu ja need ei hõlma toiminguid konkreetsete objektidega.

Teadmiste ekstensiivsed esitused on omakorda seotud konkreetsete ainevaldkonna objektide kirjeldamise ja fikseerimisega ning realiseeritakse operatsioonides, mille elementideks on objektid iseseisvate süsteemidena.

Seega on V.A. välja pakutud tunnustamismeetodite klassifitseerimise alus. Hertsog, on kehtestatud põhiseadused, mis on põhimõtteliselt aluseks inimese tunnetusviisile. See seab selle klassideks jaotuse erilisele positsioonile võrreldes teiste vähemtuntud klassifikaatoritega, mis sellel taustal tunduvad kunstlikud ja puudulikud.

2. meetodidmustrituvastus

Toore jõu meetod. Selle meetodi puhul tehakse võrdlus teatud andmebaasiga, kus iga objekti kohta esitatakse erinevad võimalused kuva muutmiseks. Näiteks optilise mustrituvastuse jaoks saate kasutada erinevate nurkade või mõõtkavade, nihkete, deformatsioonide jms loendamise meetodit. Tähtede puhul saate loetleda fondi või selle omadused. Häälikumustri tuvastamise puhul tehakse võrdlus mõne teadaoleva mustriga (paljude inimeste räägitud sõna). Järgmisena tehakse pildi omaduste põhjalikum analüüs. Optilise tuvastamise puhul võib selleks olla geomeetriliste karakteristikute määramine. Sel juhul tehakse helinäidis sageduse ja amplituudi analüüsi.

Järgmine meetod - tehisnärvivõrkude kasutamine(INS). See nõuab kas tohutul hulgal tuvastusülesande näiteid või spetsiaalset närvivõrgu struktuuri, mis võtab arvesse antud ülesande spetsiifikat. Kuid sellest hoolimata on see meetod väga tõhus ja produktiivne.

Meetodid, mis põhinevad tunnuste väärtuste jaotustiheduse hinnangutel. Laenatud klassikalisest statistiliste otsuste teooriast, milles uuritavaid objekte käsitletakse mingi seaduse järgi tunnuste ruumis jaotunud mitmemõõtmelise juhusliku suuruse realisatsioonidena. Need põhinevad Bayesi otsustusskeemil, mis apelleeritakse teatud klassi kuuluvate objektide esialgsetele tõenäosustele ja tunnuste tingimuslikele jaotustihedustele.

Tunnuste väärtuste jaotustiheduse hindamisel põhinev meetodite rühm on otseselt seotud diskriminantanalüüsi meetoditega. Bayesi lähenemine otsuste tegemisele on kaasaegse statistika üks arenenumaid parameetrilisi meetodeid, mille puhul eeldatakse, et jaotusseaduse (normaalseaduse) analüütiline väljendus on teada ja ainult väike arv parameetreid (keskmiste vektorid ja kovariatsioonimaatriksid) ) tuleb hinnata. Selle meetodi kasutamise peamisteks raskusteks peetakse vajadust meeles pidada kogu treeningvalimi tiheduse hinnangute arvutamiseks ja suurt tundlikkust treeningvalimi suhtes.

Meetodid, mis põhinevad oletustel otsustusfunktsioonide klassi kohta. Selles rühmas loetakse otsustusfunktsiooni tüüp teada ja täpsustatakse selle kvaliteedi funktsionaalsust. Selle funktsiooni põhjal leitakse treeningjärjestuse abil optimaalne lähendus otsustusfunktsioonile. Otsustusreegli kvaliteedifunktsioon on tavaliselt seotud veaga. Meetodi peamiseks eeliseks on äratundmisprobleemi matemaatilise sõnastuse selgus.Võime ammutada uusi teadmisi objekti olemuse kohta, eelkõige teadmisi atribuutide interaktsiooni mehhanismide kohta, on siinkohal antud struktuuriga põhimõtteliselt piiratud. interaktsiooni, fikseeritud otsustusfunktsioonide valitud vormis.

Prototüübiga võrdlemise meetod. See on praktikas lihtsaim laiendustuvastusmeetod. Seda kasutatakse siis, kui tunnustatud klassid on näidatud kompaktsete geomeetriliste klassidena. Seejärel valitakse prototüübipunktiks geomeetrilise rühmituse keskpunkt (või keskpunktile kõige lähemal asuv objekt).

Määratlemata objekti klassifitseerimiseks leitakse sellele lähim prototüüp ja objekt kuulub temaga samasse klassi. Ilmselgelt ei teki selle meetodi puhul üldistatud kujundeid. Mõõdikuna saab kasutada erinevat tüüpi kaugusi.

k lähimate naabrite meetod. Meetod seisneb selles, et tundmatu objekti klassifitseerimisel leitakse etteantud arv (k) geomeetriliselt kõige lähemaid tunnuseid teiste lähimate naabrite ruumist, kelle kuuluvus mis tahes klassi juba on teada. Otsus tundmatu objekti klassifitseerimise kohta tehakse selle lähimate naabrite kohta infot analüüsides. Selle meetodi puuduseks on vajadus vähendada õppevalimis olevate objektide arvu (diagnostilised pretsedendid), kuna see vähendab koolitusvalimi esinduslikkust.

Lähtudes sellest, et erinevad tuvastusalgoritmid käituvad samal valimil erinevalt, tekib küsimus sünteetilisest otsustusreeglist, mis kasutaks ära kõikide algoritmide tugevused. Selleks on sünteetiline meetod või otsustusreeglite rühmad, mis ühendavad iga meetodi kõige positiivsemad küljed.

Tuvastamismeetodite ülevaate lõpetuseks esitame eelneva olemuse koondtabelis, lisades sinna ka mõned teised praktikas kasutatavad meetodid.

Tabel 1. Tuvastamismeetodite klassifikatsiooni tabel, nende kasutusalade ja piirangute võrdlus

Tuvastamismeetodite klassifikatsioon

Kasutusala

Piirangud (puudused)

Intensiivsed äratundmismeetodid

Tiheduse hinnangutel põhinevad meetodid

Probleemid teadaoleva jaotusega (tavaline), vajadus koguda suurt statistikat

Vajadus loetleda kogu koolitusnäidis äratundmise ajal, suur tundlikkus koolitusvalimi ja artefaktide mitterepresentatiivsuse suhtes

Eelduspõhised meetodid

Klassid peavad olema hästi eraldatavad

Otsustusfunktsiooni tüüp peab olema eelnevalt teada. Suutmatus arvestada uute teadmistega tunnustevaheliste seoste kohta

Boole'i ​​meetodid

Väikesed probleemid

Loogiliste otsustusreeglite valimisel on vajalik põhjalik otsing. Kõrge töömahukus

Keelelised meetodid

Ülesanne määrata grammatika teatud väidete (objektide kirjelduste) põhjal on raskesti vormistatav. Lahendamata teoreetilised probleemid

Laiendatud tuvastamise meetodid

Prototüübiga võrdlemise meetod

Funktsiooniruumi väikese mõõtme probleemid

Klassifitseerimistulemuste suur sõltuvus mõõdikutest. Tundmatu optimaalne mõõdik

k lähimate naabrite meetod

Klassifitseerimistulemuste suur sõltuvus mõõdikutest. Koolituse valimi täieliku loendamise vajadus tunnustamise ajal. Arvutuslik pingutus

Algoritmid hinnangute arvutamiseks (ABO)

Väikesed probleemid klasside arvu ja tunnuste osas

Klassifitseerimise tulemuste sõltuvus mõõdikutest. Koolituse valimi täieliku loendamise vajadus tunnustamise ajal. Meetodi kõrge tehniline keerukus

Otsustusreeglite kollektiivid (Duuble Rule Collectives, DRC) on sünteetiline meetod.

Väikesed probleemid klasside arvu ja tunnuste osas

Meetodi väga suur tehniline keerukus, lahendamata hulk teoreetilisi probleeme nii erameetodite pädevusvaldkondade määramisel kui ka erameetodites endis

3. Mustrituvastusprobleemide üldtunnused ja nende liigid

Tuvastamissüsteemi üldine struktuur ja selle etapid on näidatud joonisel 4:

Joonis 4 - Tunnustussüsteemi struktuur

Tuvastamisülesannetel on järgmised iseloomulikud etapid:

Lähteandmete teisendamine mugavale tuvastamise vormile;

Äratundmine (näitab, et objekt kuulub teatud klassi).

Nendes ülesannetes saab tutvustada objektide sarnasuse mõistet ja sõnastada reeglistiku, mille alusel objekt kuulub ühte või erinevatesse klassidesse.

Samuti saab opereerida näidete komplektiga, mille klassifikatsioon on teada ja mida saab etteantud kirjelduste kujul deklareerida tuvastusalgoritmile õppeprotsessi käigus ülesandega kohandamiseks.

Raskused äratundmisprobleemide lahendamisel on seotud suutmatusega rakendada klassikalisi matemaatilisi meetodeid ilma parandusteta (sageli pole täpse matemaatilise mudeli teave saadaval)

Eristatakse järgmist tüüpi tuvastusülesandeid:

Tuvastamisülesandeks on esitletava objekti määramine selle kirjelduse järgi ühte etteantud klassist (juhendatud õpe);

Automaatse klassifitseerimise ülesanne on jaotada hulk disjunktsete klasside süsteemiks (taksonoomia, klasteranalüüs, iseõppimine);

Ülesanne valida äratundmisel informatiivne atribuutide komplekt;

Lähteandmete mugavasse vormi viimise ülesanne;

Dünaamiline tuvastamine ja klassifitseerimine;

Prognoosiprobleem – see tähendab, et otsus peab olema seotud konkreetse tulevikupunktiga.

Olemasolevates tunnustamissüsteemides on kaks kõige raskemat probleemi:

Probleem “1001 klass” - 1 klassi lisamine 1000 olemasolevale põhjustab raskusi süsteemi ümberõppel ja varem saadud andmete kontrollimisel;

Sõnastiku ja allikate vahelise korrelatsiooni probleem on kõnetuvastuses kõige selgem. Praegused süsteemid suudavad ära tunda kas suure hulga sõnu väikeselt isikute rühmalt või väikese arvu sõnu suurelt isikute rühmalt. Samuti on raske ära tunda suurt hulka meigi või grimassidega nägusid.

Närvivõrgud neid probleeme otseselt ei lahenda, kuid oma olemuse tõttu kohanduvad sisendjadade muutustega palju kergemini.

4. Probleemid ja väljavaatedarengutmustrituvastus

4.1 Mustrituvastuse rakendamine praktikas

Üldiselt koosneb mustrituvastuse probleem kahest osast: koolitusest ja äratundmisest. Õppimine toimub iseseisvate objektide näitamise ja ühte või teise klassi määramise teel. Treeningu tulemusena peaks äratundmissüsteem omandama oskuse reageerida samade reaktsioonidega ühe pildi kõikidele objektidele ja erinevatele teistele. Oluline on, et õppeprotsessi käigus märgitaks ainult objektid ise ja nende seotus pildiga. Koolitusele järgneb äratundmisprotsess, mis iseloomustab juba koolitatud süsteemi tegevust. Probleemiks on nende protseduuride automatiseerimine.

Enne mis tahes objekti analüüsi alustamist peate hankima selle kohta kindlat, järjestatud ja täpset teavet. Selline teave on objektide omaduste kogum, nende kuvamine tuvastussüsteemi mitmesugustel tajuorganitel.

Kuid iga vaatlusobjekt võib sõltuvalt tajutingimustest mõjutada erinevalt. Lisaks võivad sama pildi objektid üksteisest oluliselt erineda.

Iga objekti kaardistamist tuvastussüsteemi tajuorganitele, olenemata selle asukohast nende organite suhtes, nimetatakse tavaliselt objekti kujutiseks ja selliste kujutiste komplektid, mida ühendavad mõned ühised omadused, on kujutised. Esialgse kirjelduse (tunnuse ruumi) eduka valiku korral võib äratundmisülesanne osutuda üsna lihtsaks ja vastupidi, ebaõnnestunud valik võib viia väga keerulise info edasise töötlemiseni või lahenduse puudumiseni.

Objektide, signaalide, olukordade, nähtuste äratundmine on kõige tavalisem ülesanne, mida inimene peab iga sekund lahendama. Selleks kasutatakse tohutuid ajuressursse, mida hinnatakse sellise näitajaga nagu neuronite arv, mis on võrdne 10 10-ga.

Samuti kohtab tehnoloogias pidevalt äratundmist. Arvutused formaalsete neuronite võrkudes on paljuski sarnased ajus toimuva teabetöötlusega. Viimasel kümnendil on neuroarvuti saavutanud äärmise populaarsuse ja sellest on saanud kommertstoodete tootmisega seotud inseneriteadus. Neuroarvutitele elementaarse baasi loomiseks on käimas suur töö.

Nende peamine iseloomulik tunnus on võime lahendada vormistamata probleeme, mille jaoks ühel või teisel põhjusel lahendusalgoritme välja ei pakuta. Neuroarvutid pakuvad suhteliselt lihtsat tehnoloogiat algoritmide tuletamiseks õppimise kaudu. See on nende peamine eelis. Seetõttu osutub neuroarvuti aktuaalseks just praegu – multimeedia hiilgeajal, mil globaalne areng nõuab uute, pildituvastusega tihedalt seotud tehnoloogiate väljatöötamist.

Üks peamisi probleeme tehisintellekti arendamisel ja rakendamisel on endiselt heli- ja visuaalsete kujutiste äratundmise probleem. Kõik muud tehnoloogiad on juba valmis leidma rakendust meditsiinis, bioloogias ja turvasüsteemides. Meditsiinis aitab mustrituvastus arstidel täpsemaid diagnoose panna, tehastes kasutatakse seda kaubapartiide defektide ennustamiseks. Biomeetrilised isikutuvastussüsteemid põhinevad ka tuvastustulemustel kui nende algoritmilisel tuumal. Inimestega loomulikes keeltes ja kõne kaudu inimestega vahetumalt suhtlevate arvutite edasiarendamist ja disainimist ei saa lahendada ilma äratundmiseta. Siin tekib küsimus robootika ja tehisjuhtimissüsteemide arendamise kohta, mis sisaldavad tuvastussüsteeme kui olulisi alamsüsteeme.

Järeldus

Töö tulemusena tehti lühiülevaade sellise küberneetika haru nagu mustrituvastus mõistete peamistest definitsioonidest, toodi välja äratundmismeetodid, sõnastati ülesanded.

Loomulikult on selle teaduse arendamiseks palju suundi. Lisaks, nagu ühes peatükis öeldud, on tunnustamine hetkel üks võtmetähtsusega arenguvaldkondi. Seega võib tarkvara lähikümnenditel muutuda kasutajale veelgi atraktiivsemaks ja kaasaegsel turul konkurentsivõimelisemaks, kui see omandab kommertsformaadi ja hakkab levima suurele hulgale tarbijatele.

Edasised uuringud võivad olla suunatud järgmistele aspektidele: peamiste töötlemismeetodite süvaanalüüs ja uute kombineeritud või modifitseeritud tuvastamismeetodite väljatöötamine. Läbiviidud uuringute põhjal on võimalik välja töötada funktsionaalne äratundmissüsteem, mille abil on võimalik valitud tuvastusmeetodite efektiivsust testida.

Bibliograafia

1. David Formais, Jean Pons Arvutinägemine. Kaasaegne lähenemine, 2004

2. Aizerman M.A., Braverman E.M., Rozonoer L.I. Potentsiaalsete funktsioonide meetod masinõppe teoorias. - M.: Nauka, 2004.

3. Zhuravlev Yu.I. Algebralisest lähenemisest äratundmis- või klassifitseerimisprobleemide lahendamisele // Küberneetika probleemid. M.: Nauka, 2005. - Väljaanne. 33.

4. Mazurov V.D. Ebavõrdsussüsteemide komiteed ja äratundmisprobleem // Küberneetika, 2004, nr 2.

5. Potapov A.S. Mustri tuvastamine ja masina tajumine. - Peterburi: Politehnika, 2007.

6. Minsky M., Papert S. Perceptrons. - M.: Mir, 2007.

7. Rastrigin L. A., Erenshtein R. Kh. Kollektiivse tunnustamise meetod. M. Energoizdat, 2006.

8. Rudakov K.V. Klassifitseerimisprobleemide universaalsete ja lokaalsete piirangute algebralisest teooriast // Tuvastamine, klassifitseerimine, prognoos. Matemaatilised meetodid ja nende rakendamine. Vol. 1. - M.: Nauka, 2007.

9. Fu K. Struktuursed meetodid mustrituvastuses. - M.: Mir, 2005.

Postitatud saidile Allbest.ru

...

Sarnased dokumendid

    Mustrituvastuse teooria põhimõisted ja selle tähendus. Mustrituvastuse matemaatilise teooria olemus. Peamised ülesanded, mis tekivad pildituvastussüsteemide väljatöötamisel. Reaalajas mustrituvastussüsteemide klassifikatsioon.

    kursusetöö, lisatud 15.01.2014

    Mustrituvastusalgoritmide konstrueerimise kontseptsioon ja omadused. Erinevad lähenemised äratundmismeetodite tüpoloogiale. Põhiliste teadmiste esitamise viiside uurimine. Intensiooni- ja ekstensioonimeetodite tunnused, nende kvaliteedi hindamine.

    esitlus, lisatud 01.06.2014

    Mustrituvastuse teoreetilised alused. Tuvastamissüsteemi funktsionaalne diagramm. Bayesi meetodite rakendamine mustrituvastuse probleemi lahendamisel. Bayesi kujutise segmenteerimine. TAN mudel kujutiste klassifitseerimise probleemi lahendamiseks.

    lõputöö, lisatud 13.10.2017

    Ülevaade mustrituvastussüsteemide arendamisel tekkivatest probleemidest. Koolitatavad pildi klassifikaatorid. Pertseptroni algoritm ja selle modifikatsioonid. Programmi loomine, mis on mõeldud piltide klassifitseerimiseks väikseima keskmise vea meetodil.

    kursusetöö, lisatud 04.05.2015

    Mustri tuvastamise meetodid (klassifikaatorid): Bayesi, lineaarne, potentsiaalse funktsiooni meetod. Programmi väljatöötamine inimese äratundmiseks tema fotode järgi. Näiteid klassifikaatorite tööst, katsetulemused meetodite täpsuse kohta.

    kursusetöö, lisatud 15.08.2011

    Tehisnärvivõrkudel põhineva visuaalse pildituvastuse teostava tarkvara tööriista loomine. Mustri tuvastamiseks kasutatavad meetodid. Selfridge's Pandemonium. Rosenblatt Perceptron. Ahelkoodi moodustamise reegel.

    lõputöö, lisatud 04.06.2014

    Mustri tuvastamine on ülesanne tuvastada objekt või määrata selle omadused selle pildi või helisalvestuse põhjal. Selle valdkonna teoreetiliste ja tehniliste muutuste ajalugu. Arvutitehnoloogias kasutatavad meetodid ja põhimõtted äratundmiseks.

    abstraktne, lisatud 10.04.2010

    Mustrituvastussüsteemi kontseptsioon. Tunnistussüsteemide klassifikatsioon. Mikroobjektide kuju äratundmise süsteemi väljatöötamine. Algoritm mikroobjektide tuvastamise süsteemi loomiseks kristallogrammil, selle rakendamise tunnused tarkvarakeskkonnas.

    kursusetöö, lisatud 21.06.2014

    Närvivõrgu tüübi ja struktuuri valimine. Tuvastamismeetodi valik, Hopfieldi võrgu plokkskeem. Mustrituvastussüsteemi koolitamine. Programmiga töötamise omadused, selle eelised ja puudused. Kasutajaliidese ja ekraanivormide kirjeldus.

    kursusetöö, lisatud 14.11.2013

    Tehniliste automaatsete tuvastussüsteemide tekkimine. Inimene kui keerukate automaatsüsteemide element või lüli. Automaattuvastusseadmete võimalused. Mustrituvastussüsteemi loomise etapid. Mõõtmis- ja kodeerimisprotsessid.