نظم التعرف على الأنماط في مصادر المعلومات العالمية. مراجعة الأساليب الحالية للتعرف على الأنماط. أمثلة على مشاكل التعرف على الأنماط

الفصل 3: أنظمة التعرف على الأنماط (التعريف)

  • مفهوم الصورة. مشكلة تعلم التعرف على الأنماط. المناهج الهندسية والهيكلية. فرضية الاكتناز. التعليم والدراسة الذاتية. التكيف والتعلم.
  • طرق تعلم التعرف على الأنماط - الإدراك ، الشبكات العصبية ، طريقة الوظائف المحتملة ، طريقة المحاسبة الجماعية للحجج ، طريقة الحد من التبسيط ، فرق قواعد القرار.
  • طرق وخوارزميات لتحليل بنية البيانات متعددة الأبعاد - تحليل الكتلة ، التجميع الهرمي.

مفهوم الصورة

صورة ، فئة - مجموعة تصنيف في نظام التصنيف توحد (تفرد) مجموعة معينة من الكائنات وفقًا لبعض السمات.

يعد الإدراك المجازي للعالم أحد الخصائص الغامضة للدماغ الحي ، مما يجعل من الممكن فهم التدفق اللامتناهي للمعلومات المتصورة والحفاظ على التوجه في محيط البيانات المتباينة حول العالم الخارجي. بإدراك العالم الخارجي ، نصنف دائمًا الأحاسيس المدركة ، أي نقسمها إلى مجموعات من الظواهر المتشابهة ولكنها ليست متطابقة. على سبيل المثال ، على الرغم من الاختلاف الكبير ، تتضمن مجموعة واحدة جميع الأحرف A ، المكتوبة بخط يد مختلف ، أو جميع الأصوات المقابلة لنفس الملاحظة ، المأخوذة في أي أوكتاف وعلى أي أداة ، والمشغل الذي يتحكم في الكائن الفني ، ككل يتفاعل كائن مجموعة من الحالات مع نفس رد الفعل. بشكل مميز ، من أجل تشكيل مفهوم مجموعة من التصورات لفئة معينة ، يكفي التعرف على عدد صغير من ممثليها. يمكن أن يظهر للطفل حرفًا واحدًا فقط حتى يتمكن من العثور على هذا الحرف في نص مكتوب بخطوط مختلفة ، أو التعرف عليه ، حتى لو كان مكتوبًا بشكل مشوه عمدًا. تسمح لنا خاصية الدماغ هذه بصياغة مفهوم كصورة.

للصور خاصية مميزة تتجلى في حقيقة أن التعرف على عدد محدود من الظواهر من نفس المجموعة يجعل من الممكن التعرف على عدد كبير بشكل تعسفي من ممثليها. يمكن أن تكون أمثلة الصور: نهر ، بحر ، سائل ، موسيقى تشايكوفسكي ، قصائد ماياكوفسكي ، إلخ. يمكن أيضًا اعتبار مجموعة معينة من حالات كائن التحكم كصورة ، وتتميز هذه المجموعة الكاملة من الحالات بحقيقة أنه في من أجل تحقيق هدف معين ، نفس التأثير على كائن. للصور خصائص موضوعية مميزة بمعنى أن الأشخاص المختلفين الذين يتعلمون من مواد رصدية مختلفة ، في الغالب ، يصنفون نفس الأشياء بنفس الطريقة وبشكل مستقل عن بعضهم البعض. إن موضوعية الصور هي التي تسمح للناس في جميع أنحاء العالم بفهم بعضهم البعض.

تتيح القدرة على إدراك العالم الخارجي في شكل صور للفرد أن يتعرف بشكل مؤكد على عدد لا حصر له من الكائنات بناءً على التعارف مع عدد محدود منها ، والطبيعة الموضوعية للخاصية الرئيسية للصور تسمح للشخص بنمذجة عملية الاعتراف بهم. كونه انعكاسًا للواقع الموضوعي ، فإن مفهوم الصورة موضوعي مثل الواقع نفسه ، وبالتالي يمكن أن يكون هذا المفهوم في حد ذاته موضوع دراسة خاصة.

في الأدبيات المكرسة لمشكلة التعرف على أنماط التدريب (ORO) ، غالبًا ما يتم تقديم مفهوم الفصل بدلاً من مفهوم الصورة.

مشكلة التعرف على أنماط التعلم (ORO)

واحدة من أكثر الخصائص إثارة للاهتمام للدماغ البشري هي القدرة على الاستجابة لعدد لا حصر له من الظروف البيئية مع عدد محدود من ردود الفعل. ربما كانت هذه الخاصية هي التي سمحت للشخص بتحقيق أعلى شكل من أشكال وجود المادة الحية ، معبرًا عنه في القدرة على التفكير ، أي عكس العالم الموضوعي بشكل فعال في شكل صور ومفاهيم وأحكام ، وما إلى ذلك. لذلك ، فإن المشكلة من ORO نشأت عند دراسة الخصائص الفسيولوجية للدماغ.

النظر في مثال على المهام من منطقة ODP.


أرز. واحد

فيما يلي 12 مهمة يلزم فيها تحديد الميزات التي يمكن استخدامها لتمييز الثلاثي الأيسر للصور عن الموجود الأيمن. يتطلب حل هذه المشكلات نمذجة التفكير المنطقي بالكامل.

بشكل عام ، تتكون مشكلة التعرف على الأنماط من جزأين: التعلم والتعرف. يتم التعليم من خلال إظهار الأشياء الفردية مع الإشارة إلى انتمائهم إلى صورة أو أخرى. كنتيجة للتدريب ، يجب أن يكتسب نظام التعرف القدرة على الاستجابة بنفس ردود الفعل لجميع الكائنات في نفس الصورة وردود الفعل المختلفة على جميع الكائنات من الصور المختلفة. من المهم جدًا أن تنتهي عملية التعلم فقط من خلال عرض عدد محدود من العناصر دون أي مطالبات أخرى. كأشياء تعليمية ، يمكن أن تكون هناك صور أو صور بصرية أخرى (حروف) ، أو ظواهر مختلفة من العالم الخارجي ، على سبيل المثال ، الأصوات ، وحالة الجسم أثناء التشخيص الطبي ، وحالة الكائن التقني في أنظمة التحكم ، الخ. من المهم أن الكائنات فقط وانتمائهم للصورة. يتبع التدريب عملية التعرف على الأشياء الجديدة ، والتي تميز تصرفات نظام مدرب بالفعل. أتمتة هذه الإجراءات هي مشكلة التدريب على التعرف على الأنماط. في الحالة التي يخمن فيها الشخص نفسه أو يخترع ، ثم يفرض قاعدة تصنيف على الجهاز ، يتم حل مشكلة التعرف جزئيًا ، حيث يتولى الشخص الجزء الرئيسي والرئيسي من المشكلة (التدريب).

مشكلة التدريب في التعرف على الأنماط مثيرة للاهتمام من وجهة نظر تطبيقية ومن وجهة نظر أساسية. من وجهة نظر تطبيقية ، فإن حل هذه المشكلة مهم ، أولاً وقبل كل شيء ، لأنه يفتح إمكانية أتمتة العديد من العمليات التي كانت مرتبطة حتى الآن فقط بنشاط الدماغ الحي. ترتبط الأهمية الأساسية للمشكلة ارتباطًا وثيقًا بالسؤال الذي ينشأ بشكل متزايد فيما يتعلق بتطوير الأفكار في علم التحكم الآلي: ما الذي يمكن وما لا يمكن للآلة فعله بشكل أساسي؟ إلى أي مدى يمكن تقريب قدرات الآلة من قدرات الدماغ الحي؟ على وجه الخصوص ، هل يمكن للآلة تطوير القدرة على الاستحواذ من الشخص على القدرة على تنفيذ إجراءات معينة اعتمادًا على المواقف التي تنشأ في البيئة؟ حتى الآن ، أصبح من الواضح فقط أنه إذا تمكن الشخص أولاً من إدراك قدرته بنفسه ، ثم وصفها ، أي توضيح سبب قيامه بأفعال استجابةً لكل حالة من البيئة الخارجية أو كيف (بأي قاعدة) يجمع الفرد كائنات في صور ، ثم يمكن نقل هذه المهارة إلى آلة دون صعوبات أساسية. إذا كان لدى الشخص مهارة ، ولكن لا يمكنه شرحها ، فهناك طريقة واحدة فقط لنقل المهارة إلى آلة - التعلم عن طريق الأمثلة.

نطاق المهام التي يمكن حلها بمساعدة أنظمة التعرف واسع للغاية. لا يشمل هذا فقط مهام التعرف على الصور المرئية والسمعية ، ولكن أيضًا مهام التعرف على العمليات والظواهر المعقدة التي تنشأ ، على سبيل المثال ، عند اختيار الإجراءات المناسبة من قبل رئيس المؤسسة أو اختيار الإدارة المثلى للتكنولوجيا والاقتصادية والنقل. أو العمليات العسكرية. في كل مهمة من هذه المهام ، يتم تحليل بعض الظواهر والعمليات وحالات العالم الخارجي ، ويشار إليها فيما بعد بأشياء المراقبة. قبل البدء في تحليل أي عنصر ، من الضروري الحصول على معلومات معينة ومرتبة حوله بطريقة ما. هذه المعلومات هي سمة من سمات الأشياء ، وعرضها على مجموعة أجهزة الإدراك لنظام التعرف.

لكن يمكن لكل كائن مراقبة أن يتصرف بشكل مختلف ، اعتمادًا على ظروف الإدراك. على سبيل المثال ، أي حرف ، حتى لو كتب بنفس الطريقة ، يمكن ، من حيث المبدأ ، إزاحته بأي شكل من الأشكال بالنسبة للأعضاء المدركة. بالإضافة إلى ذلك ، يمكن أن تختلف كائنات نفس الصورة تمامًا عن بعضها البعض ، وبالطبع تؤثر على أعضاء الإدراك بطرق مختلفة.

عادةً ما يُطلق على كل تعيين لأي كائن للأعضاء المدركة لنظام التعرف ، بغض النظر عن موضعه بالنسبة لهذه الأعضاء ، صورة للكائن ، ومجموعات هذه الصور ، التي توحدها بعض الخصائص المشتركة ، هي صور.

عند حل مشكلات التحكم عن طريق طرق التعرف على الصور ، يتم استخدام مصطلح "حالة" بدلاً من مصطلح "صورة". الحالة هي شكل معين لعرض الخصائص الحالية (أو اللحظية) المقاسة للكائن المرصود. تحدد مجموعة الدول الموقف. مفهوم "الوضع" مشابه لمفهوم "الصورة". لكن هذا التشبيه لم يكتمل ، لأنه لا يمكن تسمية كل صورة بحالة ، على الرغم من أنه يمكن تسمية كل موقف بصورة.

عادة ما يطلق على الموقف مجموعة معينة من الحالات لكائن معقد ، تتميز كل منها بنفس الخصائص أو خصائص متشابهة للكائن. على سبيل المثال ، إذا تم اعتبار كائن تحكم معين كموضوع للمراقبة ، فإن الموقف يجمع بين حالات هذا الكائن التي يجب تطبيق إجراءات التحكم نفسها فيها. إذا كان هدف المراقبة هو لعبة عسكرية ، فإن الموقف يجمع بين جميع حالات اللعبة التي تتطلب ، على سبيل المثال ، هجوم دبابة قوي مع دعم جوي.

يعد اختيار الوصف الأولي للكائنات أحد المهام المركزية لمشكلة ODP. مع الاختيار الناجح للوصف الأولي (مساحة الميزة) ، قد تكون مهمة التعرف تافهة ، وعلى العكس من ذلك ، قد يؤدي الوصف الأولي الذي تم اختياره دون نجاح إما إلى معالجة إضافية صعبة للغاية للمعلومات ، أو إلى عدم وجود حل على الاطلاق. على سبيل المثال ، إذا تم حل مشكلة التعرف على الأشياء التي تختلف في اللون ، وتم اختيار الإشارات الواردة من مستشعرات الوزن كوصف أولي ، فلا يمكن حل مشكلة التعرف من حيث المبدأ.

المناهج الهندسية والهيكلية.

في كل مرة نواجه فيها مشاكل غير مألوفة ، هناك رغبة طبيعية في تقديمها في شكل نموذج يسهل فهمه من شأنه أن يسمح لنا بفهم المشكلة بمصطلحات يسهل تخيلنا إنتاجها. وبما أننا موجودون في المكان والزمان ، فإن أكثر ما يمكن فهمه بالنسبة لنا هو التفسير المكاني والزماني للمهام.

يمكن تمثيل أي صورة تظهر نتيجة مراقبة كائن ما في عملية التعلم أو الامتحان كمتجه ، وبالتالي كنقطة في بعض مساحة الميزة. إذا تم التأكيد على أنه عند عرض الصور ، من الممكن نسبها بشكل لا لبس فيه إلى واحدة من صورتين (أو عدة صور) ، فإنه يتم التأكيد على أنه في بعض الأماكن توجد منطقتان (أو عدة) لا تحتويان على نقاط مشتركة ، وأن الصور نقاط من هذه المناطق. يمكن تعيين اسم لكل منطقة ، أي إعطاء اسم مطابق للصورة.

دعونا الآن نفسر عملية التعرف على أنماط التعلم من حيث الصورة الهندسية ، ونقتصر في الوقت الحالي على حالة التعرف على نمطين فقط. يُفترض مقدمًا فقط أنه يلزم فصل منطقتين في بعض المساحة وأنه يتم عرض نقاط فقط من هذه المناطق. هذه المناطق نفسها ليست محددة مسبقًا ، أي لا توجد معلومات حول موقع حدودها أو قواعد لتحديد ما إذا كانت نقطة ما تنتمي إلى منطقة معينة.

في سياق التدريب ، يتم عرض النقاط التي تم اختيارها عشوائيًا من هذه المناطق ، ويتم الإبلاغ عن المعلومات حول المنطقة التي تنتمي إليها النقاط المعروضة. لم يتم تقديم أي معلومات إضافية حول هذه المناطق ، أي حول موقع حدودها ، أثناء التدريب. الهدف من التعلم هو إما بناء سطح يفصل ليس فقط النقاط الموضحة في عملية التعلم ، ولكن أيضًا جميع النقاط الأخرى التي تنتمي إلى هذه المناطق ، أو بناء الأسطح التي تربط هذه المناطق بحيث تحتوي كل منها فقط على نقاط من نفس الصورة. بمعنى آخر ، الهدف من التعلم هو بناء مثل هذه الوظائف من متجهات الصورة التي ستكون ، على سبيل المثال ، إيجابية في جميع نقاط صورة واحدة وسلبية في جميع نقاط صورة أخرى. نظرًا لحقيقة أن المناطق ليس لديها نقاط مشتركة ، فهناك دائمًا مجموعة كاملة من هذه الوظائف المنفصلة ، ونتيجة للتعلم ، يجب بناء واحدة منها.

إذا كانت الصور المقدمة لا تنتمي إلى صورتين ، بل إلى عدد أكبر من الصور ، فإن المهمة تكمن في بناء سطح ، وفقًا للنقاط التي تظهر أثناء التدريب ، يفصل بين جميع المناطق المقابلة لهذه الصور عن بعضها البعض. يمكن حل هذه المشكلة ، على سبيل المثال ، من خلال إنشاء دالة تأخذ نفس القيمة على نقاط كل منطقة ، ويجب أن تكون قيمة هذه الوظيفة على نقاط من مناطق مختلفة مختلفة.



أرز. 2 - صورتان.

للوهلة الأولى ، يبدو أن معرفة عدد معين من النقاط فقط من المنطقة لا يكفي لفصل المنطقة بأكملها. في الواقع ، يمكن للمرء تحديد عدد لا يحصى من المناطق المختلفة التي تحتوي على هذه النقاط ، وبغض النظر عن كيفية بناء السطح الذي يختار المنطقة منها ، فمن الممكن دائمًا تحديد منطقة أخرى تتقاطع مع السطح وفي نفس الوقت تحتوي على النقاط المعروضة. ومع ذلك ، فمن المعروف أن مشكلة تقريب دالة من المعلومات المتعلقة بها في مجموعة محدودة من النقاط ، والتي تكون أضيق بكثير من المجموعة الكاملة التي تُعطى الوظيفة عليها ، هي مشكلة رياضية شائعة تتعلق بتقريب الوظائف. وبالطبع فإن حل مثل هذه المشكلات يتطلب إدخال قيود معينة على فئة الوظائف قيد الدراسة ، واختيار هذه القيود يعتمد على طبيعة المعلومات التي يمكن للمدرس إضافتها في عملية التعلم. أحد هذه التلميحات هو التخمين حول انضغاط الصور. من الواضح بشكل بديهي أن تقريب وظيفة الفصل سيكون مهمة أسهل ، وكلما كانت أكثر إحكاما وأكثر تباعدا بين المناطق التي سيتم فصلها. لذلك ، على سبيل المثال ، في الحالة الموضحة في الشكل. 2 أ ، من الواضح أن الفصل أبسط مما في الحالة الموضحة في الشكل. 2 ب. في الواقع ، في الحالة الموضحة في الشكل. في الشكل 2 أ ، يمكن فصل المناطق عن طريق مستوى ، وحتى مع وجود أخطاء كبيرة في تعريف وظيفة الفصل ، فإنها ستستمر في فصل المناطق. في الحالة في الشكل. في الشكل 2 ب ، يتم الفصل بواسطة سطح معقد ، وحتى الانحرافات الطفيفة في شكله تؤدي إلى أخطاء في الفصل. كانت هذه الفكرة البديهية للمناطق القابلة للفصل نسبيًا هي التي أدت إلى تخمين الاكتناز.

إلى جانب التفسير الهندسي لمشكلة تعلم التعرف على الأنماط ، هناك نهج آخر يسمى الهيكلي أو اللغوي. دعونا نشرح النهج اللغوي باستخدام مثال التعرف على الصور المرئية. أولاً ، يتم تمييز مجموعة من المفاهيم الأولية - الأجزاء النموذجية الموجودة في الصور ، وخصائص الترتيب المتبادل للشظايا - "يسار" ، "أسفل" ، "داخلي" ، إلخ. تشكل هذه المفاهيم الأولية قاموسًا يسمح لك ببناء عبارات منطقية مختلفة ، تسمى أحيانًا افتراضات. المهمة هي الاختيار من بين عدد كبير من العبارات التي يمكن إنشاؤها باستخدام هذه المفاهيم ، والأكثر أهمية لهذه الحالة بالذات.

علاوة على ذلك ، بالنظر إلى عدد محدود ، وإذا أمكن ، عدد صغير من الكائنات من كل صورة ، فمن الضروري إنشاء وصف لهذه الصور. يجب أن تكون الأوصاف التي تم إنشاؤها كاملة بحيث يتم حل مسألة الصورة التي ينتمي إليها الكائن المحدد. عند تنفيذ النهج اللغوي ، تظهر مشكلتان: مشكلة إنشاء قاموس أولي ، أي مجموعة من الأجزاء النموذجية ، ومشكلة إنشاء قواعد وصف من عناصر قاموس معين.

في إطار التفسير اللغوي ، يتم رسم تشبيه بين بنية الصور وتركيب اللغة. كانت الرغبة في هذا القياس ناتجة عن إمكانية استخدام جهاز اللغويات الرياضية ، أي أن الأساليب نحوية بطبيعتها. لا يمكن تطبيق استخدام جهاز اللغويات الرياضية لوصف بنية الصور إلا بعد إجراء تجزئة للصور إلى الأجزاء المكونة لها ، أي تم تطوير الكلمات لوصف الأجزاء النموذجية وطرق البحث عنها. بعد العمل التمهيدي ، الذي يضمن اختيار الكلمات ، تنشأ المهام اللغوية المناسبة ، والتي تتكون من مهام التحليل النحوي التلقائي للأوصاف من أجل التعرف على الصور. في الوقت نفسه ، يظهر مجال بحثي مستقل ، لا يتطلب فقط معرفة أساسيات علم اللغة الرياضي ، ولكن أيضًا إتقان التقنيات التي تم تطويرها خصيصًا لمعالجة الصور اللغوية.

فرضية الاكتناز

إذا افترضنا أنه في عملية التعلم ، يتم تشكيل مساحة الميزة بناءً على التصنيف المخطط ، فيمكننا أن نأمل أن تحدد مواصفات مساحة الميزة نفسها خاصية ، تحت تأثير يمكن فصل الصور في هذا الفضاء بسهولة. هذه الآمال ، مع تطور العمل في مجال التعرف على الأنماط ، حفزت ظهور فرضية الانضغاط ، والتي تنص على أن المجموعات المدمجة في مساحة الميزة تتوافق مع الأنماط. من خلال مجموعة مضغوطة ، في الوقت الحالي ، نعني بعض "مجموعات" من النقاط في مساحة الصورة ، بافتراض وجود خلل يفصل بينها بين هذه المجموعات.

ومع ذلك ، لم يكن من الممكن دائمًا تأكيد هذه الفرضية تجريبيًا ، ولكن الأهم من ذلك ، تلك المهام التي أدت فيها فرضية الانضغاط بشكل جيد (الشكل 2 أ) ، بدون استثناء ، وجدت جميعها حلاً بسيطًا. والعكس صحيح ، تلك المهام التي لم يتم تأكيد الفرضية بشأنها (الشكل 2 ب) إما لم يتم حلها على الإطلاق ، أو تم حلها بصعوبة كبيرة باستخدام حيل إضافية. هذه الحقيقة جعلتنا على الأقل نشك في صحة فرضية الاكتناز ، لأن مثالًا واحدًا ينفي ذلك يكفي لدحض أي فرضية. في الوقت نفسه ، فإن تحقيق الفرضية أينما كان من الممكن حل مشكلة التدريب في التعرف على الأنماط أبقى الاهتمام بهذه الفرضية. لقد تحولت فرضية الاكتناز نفسها إلى علامة على إمكانية التوصل إلى حل مرض لمشاكل التعرف.

إن صياغة فرضية الانضغاط تقربنا من مفهوم الصورة المجردة. إذا تم اختيار إحداثيات الفضاء بشكل عشوائي ، فسيتم توزيع الصور الموجودة فيه بشكل عشوائي. ستكون أكثر كثافة في بعض أجزاء الفضاء أكثر من أجزاء أخرى. دعنا نسمي بعض الفضاء المختار عشوائيا صورة مجردة. في هذا الفضاء المجرد ، سيكون هناك بالتأكيد مجموعات مضغوطة من النقاط. لذلك ، وفقًا لفرضية الانضغاط ، يمكن تسمية مجموعة الكائنات التي تتوافق مع مجموعات مضغوطة من النقاط في مساحة مجردة بشكل معقول بالصور المجردة لمساحة معينة.

التعليم والدراسة الذاتية. التكيف والتعلم

جميع الصور المعروضة في الشكل. 1 صِف مهمة التعلم. في كل من هذه المشاكل ، يتم إعطاء عدة أمثلة (تسلسل التدريب) للمشاكل التي تم حلها بشكل صحيح. إذا كان من الممكن ملاحظة خاصية عالمية معينة لا تعتمد إما على طبيعة الصور أو على صورها ، ولكنها تحدد فقط قدرتها على الفصل ، ثم إلى جانب المهمة المعتادة المتمثلة في تعلم التعرف ، باستخدام معلومات حول الانتماء لكل كائن من تسلسل التدريب إلى صورة أو أخرى يمكن للمرء أن يطرح مشكلة تصنيف مختلفة - ما يسمى بمشكلة التعلم بدون معلم. يمكن صياغة مهمة من هذا النوع على المستوى الوصفي على النحو التالي: يتم تقديم الكائنات إلى النظام في وقت واحد أو بالتتابع دون أي إشارة إلى انتمائها إلى الصور. يقوم جهاز الإدخال الخاص بالنظام بتعيين مجموعة من الكائنات على مجموعة من الصور ، وباستخدام بعض خصائص إمكانية فصل الصور المضمنة فيه مسبقًا ، يقوم بإجراء تصنيف مستقل لهذه الكائنات. بعد هذه العملية من التعلم الذاتي ، يجب أن يكتسب النظام القدرة على التعرف ليس فقط على الأشياء المألوفة بالفعل (كائنات من تسلسل التدريب) ، ولكن أيضًا تلك التي لم يتم تقديمها من قبل. إن عملية التعلم الذاتي لنظام معين هي مثل هذه العملية ، ونتيجة لذلك يكتسب هذا النظام ، دون مساعدة المعلم ، القدرة على تطوير ردود الفعل نفسها على صور كائنات من نفس الصورة وردود فعل مختلفة على صور مختلفة من الصور. يتمثل دور المعلم في هذه الحالة فقط في دفع النظام إلى بعض الخصائص الموضوعية التي هي نفسها لجميع الصور وتحديد القدرة على تقسيم مجموعة من الكائنات إلى صور.

اتضح أن هذه الخاصية الموضوعية هي خاصية انضغاط الصور. يحتوي الترتيب المتبادل للنقاط في المساحة المحددة بالفعل على معلومات حول كيفية تقسيم مجموعة النقاط. تحدد هذه المعلومات خاصية فصل الأنماط ، وهي كافية للتعلم الذاتي لنظام التعرف على الأنماط.

معظم خوارزميات التعلم الذاتي المعروفة قادرة على استخراج الصور المجردة فقط ، أي المجموعات المدمجة في مساحات معينة. يبدو أن الاختلاف بينهما يكمن في إضفاء الطابع الرسمي على مفهوم الاكتناز. ومع ذلك ، فإن هذا لا يقلل ، بل ويزيد في بعض الأحيان من قيمة خوارزميات التعلم الذاتي ، نظرًا لأن الصور نفسها لا يتم تحديدها مسبقًا من قبل أي شخص في كثير من الأحيان ، والمهمة هي تحديد مجموعات فرعية من الصور في مساحة معينة هي الصور. من الأمثلة الجيدة على مثل هذا الإعداد للمهام البحث الاجتماعي ، عندما يتم تمييز مجموعات من الأشخاص بمجموعة من الأسئلة. في هذا الفهم للمشكلة ، تولد خوارزميات التعلم الذاتي معلومات غير معروفة سابقًا حول وجود صور في مساحة معينة لم يكن لدى أي شخص أي فكرة عنها من قبل.

بالإضافة إلى ذلك ، فإن نتيجة التعلم الذاتي تميز مدى ملاءمة المساحة المختارة لمهمة تعلم التعرف المحددة. إذا كانت الصور المجردة المحددة في عملية التعلم الذاتي تتطابق مع الصور الحقيقية ، فسيتم اختيار المساحة جيدًا. كلما كانت الصور المجردة تختلف عن الصور الحقيقية ، كلما كانت المساحة المختارة "غير ملائمة" لمهمة معينة.

عادةً ما يُطلق على التعلم عملية تطوير رد فعل معين في بعض الأنظمة على مجموعات من الإشارات الخارجية المتطابقة من خلال التأثير المتكرر على نظام التصحيح الخارجي. عادة ما يسمى هذا التعديل الخارجي في التدريب "التشجيع" و "العقاب". تحدد آلية إنشاء هذا التعديل بشكل شبه كامل خوارزمية التعلم. يختلف التعلم الذاتي عن التعلم حيث لا يتم الإبلاغ هنا عن معلومات إضافية حول صحة رد الفعل على النظام.

التكيف هو عملية تغيير معلمات النظام وهيكله ، وربما إجراءات التحكم بناءً على المعلومات الحالية من أجل تحقيق حالة معينة من النظام مع عدم اليقين الأولي وظروف التشغيل المتغيرة.

التعلم هو عملية ، ونتيجة لذلك يكتسب النظام تدريجياً القدرة على الاستجابة بردود الفعل اللازمة لمجموعات معينة من التأثيرات الخارجية ، والتكيف هو تعديل معلمات وهيكل النظام من أجل تحقيق الجودة المطلوبة السيطرة في ظروف التغيرات المستمرة في الظروف الخارجية.

وعلامات. يتم حل مثل هذه المهام في كثير من الأحيان ، على سبيل المثال ، عند عبور أو قيادة الشارع عند إشارات المرور. يتيح لك التعرف على لون إشارة المرور المضاءة ومعرفة قواعد الطريق اتخاذ القرار الصحيح بشأن عبور الشارع في الوقت الحالي أم لا.

في عملية التطور البيولوجي ، حل العديد من الحيوانات المشاكل بمساعدة الأجهزة البصرية والسمعية. التعرف على الأنماطجيد بما فيه الكفاية. إنشاء أنظمة اصطناعية التعرف على الأنماطتظل مشكلة نظرية وتقنية صعبة. تظهر الحاجة إلى مثل هذا الاعتراف في مجموعة متنوعة من المجالات - من الشؤون العسكرية والأنظمة الأمنية إلى رقمنة جميع أنواع الإشارات التناظرية.

تقليديا ، يتم تضمين مهام التعرف على الصور في نطاق مهام الذكاء الاصطناعي.

الاتجاهات في التعرف على الأنماط

هناك اتجاهان رئيسيان:

  • دراسة قدرات التعرف التي تمتلكها الكائنات الحية ، وتفسيرها ونمذجة ؛
  • تطوير نظرية وأساليب بناء الأجهزة المصممة لحل المشكلات الفردية في المشكلات التطبيقية.

بيان رسمي للمشكلة

التعرف على الأنماط هو تخصيص البيانات الأولية لفئة معينة من خلال إبراز الميزات الأساسية التي تميز هذه البيانات من الكتلة الإجمالية للبيانات غير الأساسية.

عند تحديد مشاكل التعرف ، يحاولون استخدام اللغة الرياضية ، ومحاولة ، على عكس نظرية الشبكات العصبية الاصطناعية ، حيث الأساس هو الحصول على نتيجة بالتجربة ، لاستبدال التجربة بالمنطق المنطقي والبراهين الرياضية.

غالبًا ما يتم اعتبار الصور أحادية اللون في مشكلات التعرف على الأنماط ، مما يجعل من الممكن اعتبار الصورة كدالة على مستوى. إذا أخذنا في الاعتبار نقطة محددة على مستوى تيحيث الوظيفة x(x,ذ) يعبر في كل نقطة من الصورة عن خصائصها - السطوع والشفافية والكثافة البصرية ، فإن هذه الوظيفة هي سجل رسمي للصورة.

مجموعة كل الوظائف الممكنة x(x,ذ) على السطح تي- يوجد نموذج لمجموعة كل الصور X. تقديم المفهوم التشابهبين الصور ، يمكنك تعيين مهمة التعرف. يعتمد الشكل المحدد لمثل هذا الإعداد بشدة على المراحل اللاحقة في الاعتراف وفقًا لهذا النهج أو ذاك.

طرق التعرف على الأنماط

للتعرف البصري على الصور ، يمكنك تطبيق طريقة التكرار على نوع الكائن في زوايا مختلفة ، ومقاييس ، وإزاحات ، وما إلى ذلك. بالنسبة للأحرف ، تحتاج إلى تكرار الخط ، وخصائص الخط ، وما إلى ذلك.

الطريقة الثانية هي العثور على محيط الكائن وفحص خصائصه (التوصيل ، وجود الزوايا ، إلخ)

نهج آخر هو استخدام الشبكات العصبية الاصطناعية. تتطلب هذه الطريقة إما عددًا كبيرًا من الأمثلة لمهمة التعرف (مع الإجابات الصحيحة) ، أو بنية شبكة عصبية خاصة تأخذ في الاعتبار تفاصيل هذه المهمة.

Perceptron كطريقة للتعرف على الأنماط

روزنبلات ، الذي قدم مفهوم نموذج الدماغ ، الذي تتمثل مهمته في إظهار كيف يمكن أن تنشأ الظواهر النفسية في بعض الأنظمة الفيزيائية ، والتي تُعرف بنيتها وخواصها الوظيفية - وصف أبسطها تجارب التمييز. ترتبط هذه التجارب تمامًا بأساليب التعرف على الأنماط ، ولكنها تختلف من حيث أن خوارزمية الحل ليست حتمية.

أبسط تجربة ، على أساسها يمكن الحصول على معلومات ذات دلالة نفسية حول نظام معين ، تتلخص في حقيقة أن النموذج يتم تقديمه بمحفزين مختلفين ومطلوب للاستجابة لهما بطرق مختلفة. قد يكون الغرض من مثل هذه التجربة هو دراسة إمكانية تمييزهم التلقائي من قبل النظام في حالة عدم تدخل من المجرب ، أو على العكس من ذلك ، لدراسة التمييز القسري ، حيث يسعى المجرب إلى تعليم النظام لتنفيذ التصنيف المطلوب.

في تجربة التعلم ، عادة ما يتم تقديم الباسترون مع سلسلة معينة من الصور ، والتي تشمل ممثلين عن كل فئة من الفئات المراد تمييزها. وفقًا لبعض قواعد تعديل الذاكرة ، يتم تعزيز الاختيار الصحيح للتفاعل. ثم يتم تقديم حافز التحكم إلى المدرك ويتم تحديد احتمال الحصول على الاستجابة الصحيحة لمحفزات هذه الفئة. اعتمادًا على ما إذا كان حافز التحكم المحدد يطابق أو لا يتطابق مع إحدى الصور التي تم استخدامها في تسلسل التدريب ، يتم الحصول على نتائج مختلفة:

  • 1. إذا كان حافز التحكم لا يتطابق مع أي من محفزات التعلم ، فإن التجربة لا ترتبط فقط مع محض تمييز، ولكنها تتضمن أيضًا عناصر التعميمات.
  • 2. إذا كان منبه التحكم يثير مجموعة معينة من العناصر الحسية التي تختلف تمامًا عن تلك العناصر التي تم تنشيطها تحت تأثير المنبهات المقدمة سابقًا من نفس الفئة ، فإن التجربة هي دراسة التعميم الخالص .

لا تمتلك المدركات القدرة على التعميم الخالص ، لكنها تعمل بشكل مرضٍ تمامًا في تجارب التمييز ، خاصةً إذا كان محفز التحكم يتطابق بشكل وثيق مع أحد الأنماط التي اكتسب المدرك بعض الخبرة عنها بالفعل.

أمثلة على مشاكل التعرف على الأنماط

  • التعرف على الحروف.
  • التعرف على الباركود.
  • التعرف على لوحة الترخيص.
  • تمييز الوجوه.
  • التعرف على الكلام.
  • التعرف على الصور.
  • التعرف على المناطق المحلية من قشرة الأرض التي توجد فيها الرواسب المعدنية.

برامج التعرف على الأنماط

أنظر أيضا

ملاحظات

الروابط

  • يوري ليفشيتس. دورة "المشكلات الحديثة للمعلوماتية النظرية" - محاضرات حول الأساليب الإحصائية للتعرف على الأنماط ، والتعرف على الوجوه ، وتصنيف النص.
  • مجلة أبحاث التعرف على الأنماط (مجلة أبحاث التعرف على الأنماط)

المؤلفات

  • ديفيد أ. فورسيث ، جان بونسرؤية الكمبيوتر. المنهج الحديث = رؤية الكمبيوتر: منهج حديث. - م: "ويليامز" ، 2004. - ص 928. - ردمك 0-13-085198-1
  • جورج ستوكمان ، ليندا شابيرورؤية الكمبيوتر = رؤية الكمبيوتر. - م: بينوم. معمل المعرفة ، 2006. - S. 752. - ISBN 5947743841
  • A.L. Gorelik ، V.A. Skripkinطرق التعرف ، م: المدرسة العليا ، 1989.
  • ش.- ك. تشنغ، مبادئ تصميم نظم المعلومات المرئية ، م: مير ، 1994.

مؤسسة ويكيميديا. 2010.

في التكنولوجيا ، اتجاه علمي وتقني مرتبط بتطوير الأساليب وبناء الأنظمة (بما في ذلك على أساس الكمبيوتر) لإثبات انتماء كائن (الموضوع ، العملية ، الظاهرة ، الوضع ، الإشارة) إلى أحد قبل ... ... قاموس موسوعي كبير

إحدى المناطق الجديدة علم التحكم الذاتي. محتوى نظرية R. about. هو استقراء خصائص الأشياء (الصور) التي تنتمي إلى عدة فئات إلى أشياء قريبة منها إلى حد ما. عادة ، عند تعليم الإنسان الآلي عن. هناك ... ... الموسوعة الجيولوجية

إنجليزي الاعتراف والصورة ألمانية Gestalt Alterkennung. فرع من علم التحكم الآلي الرياضي الذي يطور مبادئ وأساليب لتصنيف وتحديد الكائنات الموصوفة من خلال مجموعة محدودة من الميزات التي تميزها. أنتينازي. موسوعة ... ... موسوعة علم الاجتماع

التعرف على الأنماط- طريقة لدراسة الأشياء المعقدة بمساعدة الكمبيوتر ؛ تتمثل في اختيار الميزات وتطوير الخوارزميات والبرامج التي تسمح لأجهزة الكمبيوتر بتصنيف الكائنات تلقائيًا وفقًا لهذه الميزات. على سبيل المثال ، لتحديد أي ... القاموس الاقتصادي والرياضي

- (تقني) ، اتجاه علمي وتقني مرتبط بتطوير الأساليب وبناء الأنظمة (بما في ذلك الأنظمة القائمة على الكمبيوتر) لإثبات انتماء كائن (الموضوع ، العملية ، الظاهرة ، الوضع ، الإشارة) إلى أحد قبل ... ... قاموس موسوعي

التعرف على الأنماط- قسم من علم التحكم الآلي الرياضي الذي يطور طرقًا لتصنيف ، وكذلك تحديد الأشياء ، والظواهر ، والعمليات ، والإشارات ، ومواقف كل تلك الكائنات التي يمكن وصفها بمجموعة محدودة من ميزات أو خصائص معينة ، ... ... الموسوعة السوسيولوجية الروسية

التعرف على الأنماط- 160 التعرف على النمط: تحديد تمثيلات النماذج والتشكيلات باستخدام الوسائل الآلية

تُفهم الصورة على أنها وصف منظم للكائن أو الظاهرة قيد الدراسة ، ويمثلها ناقل سمة ، يمثل كل عنصر منها القيمة العددية لإحدى السمات التي تميز الكائن المقابل.

الهيكل العام لنظام التعرف هو كما يلي:

يتمثل معنى مشكلة التعرف في تحديد ما إذا كانت الكائنات المدروسة لها مجموعة محددة ومحدودة من الميزات التي تتيح تخصيصها لفئة معينة. مهام التعرف لها السمات المميزة التالية:

1. هذه مهام إعلامية تتكون من مرحلتين:

أ. إحضار البيانات المصدر إلى نموذج مناسب للتعرف عليها.

ب. الاعتراف بحد ذاته هو مؤشر على انتماء كائن إلى فئة معينة.

2. في هذه المشاكل ، يمكن للمرء أن يقدم مفهوم التشابه أو التشابه بين الأشياء وصياغة مفهوم القرب من الأشياء كأساس لتخصيص الكائنات لنفس الفئة أو الفئات المختلفة.

3. في هذه المهام ، من الممكن العمل مع مجموعة من السوابق - أمثلة ، تصنيفها معروف والتي ، في شكل أوصاف رسمية ، يمكن تقديمها إلى خوارزمية التعرف من أجل تعديل المهمة في التعلم معالجة.

4. بالنسبة لهذه المشاكل ، من الصعب بناء نظريات رسمية وتطبيق الطرق الرياضية الكلاسيكية: غالبًا ما تكون المعلومات الخاصة بنموذج رياضي دقيق أو المكاسب من استخدام النموذج والطرق الرياضية غير قابلة للقياس مع التكاليف.

5. في هذه المهام ، تكون "المعلومات السيئة" ممكنة - معلومات بها فجوات ، غير متجانسة ، غير مباشرة ، غامضة ، غامضة ، احتمالية.

يُنصح بالتمييز بين الأنواع التالية من مهام التعرف:

1. مهمة التعرف ، أي إسناد الشيء المعروض وفقًا لوصفه إلى إحدى الفصول الدراسية المعينة (تدريب مع مدرس).

2. مهمة التصنيف الآلي هي تقسيم مجموعة من الأشياء (المواقف) وفقًا لأوصافها إلى نظام من الفئات غير المتداخلة (التصنيف ، التحليل العنقودي ، التعلم غير الخاضع للإشراف).

3. مشكلة اختيار مجموعة إعلامية من الميزات في التعرف.

4. مشكلة اختزال البيانات الأولية إلى شكل مناسب للتعرف عليها.

5. التعرف الديناميكي والتصنيف الديناميكي - المهمتان 1 و 2 للكائنات الديناميكية.

6. مهمة التنبؤ - المهام 5 ، حيث يجب أن يشير الحل إلى لحظة ما في المستقبل.

مفهوم الصورة.

الصورة ، الفئة هي مجموعة تصنيف في النظام توحد (تفرد) مجموعة معينة من الكائنات وفقًا لبعض السمات. تحتوي الصور على عدد من الخصائص المميزة ، والتي تتجلى في حقيقة أن التعرف على عدد محدود من الظواهر من نفس المجموعة يجعل من الممكن التعرف على عدد كبير بشكل تعسفي من ممثليها.


كصورة ، يمكن للمرء أيضًا التفكير في مجموعة معينة من حالات كائن التحكم ، وتتميز هذه المجموعة الكاملة من الحالات بحقيقة أنه من أجل تحقيق هدف معين ، فإن نفس التأثير على الكائن مطلوب. للصور خصائص موضوعية مميزة بمعنى أن الأشخاص المختلفين الذين يتعلمون من مواد رصدية مختلفة ، في الغالب ، يصنفون نفس الأشياء بنفس الطريقة وبشكل مستقل عن بعضهم البعض.

بشكل عام ، تتكون مشكلة التعرف على الأنماط من جزأين: التدريب والتعرف.

يتم التعليم من خلال إظهار الأشياء الفردية مع الإشارة إلى انتمائهم إلى صورة أو أخرى. كنتيجة للتدريب ، يجب أن يكتسب نظام التعرف القدرة على الاستجابة بنفس ردود الفعل لجميع الكائنات في نفس الصورة وردود الفعل المختلفة على جميع الكائنات من الصور المختلفة.

من المهم جدًا أن تنتهي عملية التعلم فقط من خلال عرض عدد محدود من العناصر دون أي مطالبات أخرى. يمكن أن تكون كائنات التعلم إما صورًا مرئية ، أو ظواهر مختلفة من العالم الخارجي ، وغيرها.

يتبع التدريب عملية التعرف على الأشياء الجديدة ، والتي تميز تشغيل نظام مدرب بالفعل. أتمتة هذه الإجراءات هي مشكلة التدريب على التعرف على الأنماط. في الحالة التي يحل فيها الشخص بنفسه أو يخترع ، ثم يفرض على الكمبيوتر قواعد التصنيف ، يتم حل مشكلة التعرف جزئيًا ، حيث يتولى الشخص الجزء الرئيسي والرئيسي من المشكلة (التدريب).

مشكلة التدريب في التعرف على الأنماط مثيرة للاهتمام من وجهة نظر تطبيقية ومن وجهة نظر أساسية. من وجهة نظر تطبيقية ، فإن حل هذه المشكلة مهم ، أولاً وقبل كل شيء ، لأنه يفتح إمكانية أتمتة العديد من العمليات التي كانت مرتبطة حتى الآن فقط بنشاط الدماغ الحي. ترتبط الأهمية الأساسية للمشكلة بمسألة ما يمكن للحاسوب فعله وما لا يمكنه فعله من حيث المبدأ.

عند حل مشكلات إدارة طرق التعرف على الأنماط ، يتم استخدام مصطلح "حالة" بدلاً من مصطلح "صورة". الحالة - أشكال معينة من عرض الخصائص الحالية المقاسة (اللحظية) للكائن المرصود ، تحدد مجموعة الحالات الموقف.

عادة ما يطلق على الموقف مجموعة معينة من الحالات لكائن معقد ، تتميز كل منها بنفس الخصائص أو خصائص متشابهة للكائن. على سبيل المثال ، إذا تم اعتبار كائن تحكم معين كموضوع للمراقبة ، فإن الموقف يجمع بين حالات هذا الكائن التي يجب تطبيق إجراءات التحكم نفسها فيها. إذا كان هدف الملاحظة لعبة ، فإن الموقف يوحد جميع حالات اللعبة.

يعد اختيار الوصف الأولي للكائنات أحد المهام المركزية لمشكلة التعرف على أنماط التعلم. مع الاختيار الناجح للوصف الأولي (مساحة الميزة) ، قد تصبح مهمة التعرف تافهة. على العكس من ذلك ، فإن الوصف الأولي الذي تم اختياره دون نجاح يمكن أن يؤدي إما إلى معالجة إضافية صعبة للغاية للمعلومات ، أو إلى عدم وجود حل على الإطلاق.

المناهج الهندسية والهيكلية.

يمكن تمثيل أي صورة تظهر نتيجة مراقبة كائن ما في عملية التعلم أو الامتحان كمتجه ، وبالتالي كنقطة في بعض مساحة الميزة.

إذا قيل أنه عند عرض الصور ، من الممكن نسبها بشكل لا لبس فيه إلى واحدة من صورتين (أو عدة صور) ، فإنه يتم التأكيد على أنه في بعض الأماكن توجد منطقتان أو أكثر لا تحتويان على نقاط مشتركة ، وأن صورة نقطة من هذه المناطق. يمكن تعيين اسم لكل نقطة في هذه المنطقة ، أي إعطاء اسم مطابق للصورة.

دعونا نفسر عملية التعرف على أنماط التعلم من حيث الصورة الهندسية ، ونقصر أنفسنا في الوقت الحالي على حالة التعرف على نمطين فقط. الشيء الوحيد المعروف مسبقًا هو أنه من الضروري فصل منطقتين في بعض المساحة وأنه يتم عرض نقاط فقط من هذه المناطق. هذه المناطق نفسها ليست محددة مسبقًا ، أي لا توجد معلومات حول موقع حدودها أو قواعد لتحديد ما إذا كانت نقطة ما تنتمي إلى منطقة معينة.

في سياق التدريب ، يتم عرض النقاط التي تم اختيارها عشوائيًا من هذه المناطق ، ويتم الإبلاغ عن المعلومات حول المنطقة التي تنتمي إليها النقاط المعروضة. لم يتم الإبلاغ عن أي معلومات إضافية حول هذه المناطق ، أي موقع حدودها أثناء التدريب.

الهدف من التعلم هو إما بناء سطح يفصل ليس فقط النقاط الموضحة في عملية التعلم ، ولكن أيضًا جميع النقاط الأخرى التي تنتمي إلى هذه المناطق ، أو بناء الأسطح التي تربط هذه المناطق بحيث تحتوي كل منها فقط على نقاط من نفس الصورة. بمعنى آخر ، الهدف من التعلم هو بناء مثل هذه الوظائف من متجهات الصورة التي ستكون ، على سبيل المثال ، إيجابية في جميع نقاط صورة واحدة وسلبية في جميع نقاط صورة أخرى.

نظرًا لحقيقة أن المناطق ليس لديها نقاط مشتركة ، فهناك دائمًا مجموعة كاملة من هذه الوظائف المنفصلة ، ونتيجة للتعلم ، يجب بناء واحدة منها. إذا كانت الصور المقدمة لا تنتمي إلى صورتين ، بل إلى عدد أكبر من الصور ، فإن المهمة تكمن في بناء سطح ، وفقًا للنقاط التي تظهر أثناء التدريب ، يفصل بين جميع المناطق المقابلة لهذه الصور عن بعضها البعض.

يمكن حل هذه المشكلة ، على سبيل المثال ، من خلال إنشاء دالة تأخذ نفس القيمة على نقاط كل منطقة ، ويجب أن تكون قيمة هذه الوظيفة على نقاط من مناطق مختلفة مختلفة.

قد يبدو أن معرفة عدد معين من النقاط من المنطقة لا يكفي لفصل المنطقة بأكملها. في الواقع ، يمكن للمرء تحديد عدد لا يحصى من المناطق المختلفة التي تحتوي على هذه النقاط ، وبغض النظر عن كيفية بناء السطح الذي يختار المنطقة منها ، فمن الممكن دائمًا تحديد منطقة أخرى تتقاطع مع السطح وفي نفس الوقت تحتوي على النقاط المعروضة.

ومع ذلك ، فمن المعروف أن مشكلة تقريب دالة من المعلومات المتعلقة بها في مجموعة محدودة من النقاط أضيق بكثير من المجموعة الكاملة التي تُعطى الوظيفة عليها ، وهي مشكلة رياضية شائعة تتعلق بتقريب الوظائف. وبالطبع فإن حل مثل هذه المشكلات يتطلب إدخال قيود معينة على فئة الوظائف قيد الدراسة ، واختيار هذه القيود يعتمد على طبيعة المعلومات التي يمكن للمدرس إضافتها إلى عملية التعلم.

أحد هذه التلميحات هو التخمين حول انضغاط الصور.

إلى جانب التفسير الهندسي لمشكلة التعرف على أنماط التعلم ، هناك نهج آخر يسمى الهيكلي أو اللغوي. لنفكر في النهج اللغوي في مثال التعرف على الصور المرئية.

أولاً ، يتم تمييز مجموعة من المفاهيم الأولية - الأجزاء النموذجية الموجودة في الصورة ، وخصائص الموضع النسبي للأجزاء (اليسار ، الأسفل ، الداخل ، إلخ). تشكل هذه المفاهيم الأولية مفردات تسمح لك ببناء جمل منطقية مختلفة ، تسمى أحيانًا الجمل.

المهمة هي الاختيار من بين عدد كبير من العبارات التي يمكن إنشاؤها باستخدام هذه المفاهيم ، والأكثر أهمية لهذه الحالة بالذات. علاوة على ذلك ، بالنظر إلى عدد محدود ، وإذا أمكن ، عدد صغير من الكائنات من كل صورة ، فمن الضروري إنشاء وصف لهذه الصور.

يجب أن تكون الأوصاف التي تم إنشاؤها كاملة بحيث يتم حل مسألة الصورة التي ينتمي إليها الكائن المحدد. عند تنفيذ النهج اللغوي ، تنشأ مهمتان: مهمة إنشاء قاموس أولي ، أي مجموعة من الأجزاء النموذجية ، ومهمة إنشاء قواعد وصف من عناصر قاموس معين.

في إطار التفسير اللغوي ، يتم رسم تشبيه بين بنية الصور وتركيب اللغة. كانت الرغبة في هذا القياس ناتجة عن إمكانية استخدام جهاز اللغويات الرياضية ، أي أن الأساليب نحوية بطبيعتها. لا يمكن تطبيق استخدام جهاز اللغويات الرياضية لوصف بنية الصور إلا بعد إجراء تقسيم الصور إلى أجزاء مكونة ، أي تم تطوير الكلمات لوصف الأجزاء النموذجية وطرق البحث عنها.

بعد العمل التمهيدي ، الذي يضمن اختيار الكلمات ، تنشأ المهام اللغوية المناسبة ، والتي تتكون من مهام التحليل النحوي التلقائي للأوصاف من أجل التعرف على الصور.

فرضية الاكتناز.

إذا افترضنا أنه في عملية التعلم ، يتم تشكيل مساحة الميزة بناءً على التصنيف المخطط ، فيمكننا أن نأمل أن تحدد مواصفات مساحة الميزة نفسها خاصية ، تحت تأثير يمكن فصل الصور في هذا الفضاء بسهولة. هذه الآمال ، مع تطور العمل في مجال التعرف على الأنماط ، حفزت ظهور فرضية الانضغاط ، والتي تنص على أن المجموعات المدمجة في مساحة الميزة تتوافق مع الأنماط.

من خلال مجموعة مضغوطة ، سنفهم مجموعات معينة من النقاط في مساحة الصورة ، بافتراض وجود خلل يفصل بينها بين هذه المجموعات. ومع ذلك ، لم يتم تأكيد هذه الفرضية دائمًا بشكل تجريبي. لكن تلك المشكلات التي تم فيها تنفيذ فرضية الانضغاط بشكل جيد ، وجدت دائمًا حلًا بسيطًا ، والعكس صحيح ، تلك المشكلات التي لم يتم تأكيد الفرضية بشأنها لم يتم حلها على الإطلاق ، أو تم حلها بصعوبة كبيرة ومعلومات إضافية.

أصبحت فرضية الاكتناز نفسها علامة على إمكانية حل مشاكل التعرف بشكل مرض.

إن صياغة فرضية الانضغاط تقربنا من مفهوم الصورة المجردة. إذا تم اختيار إحداثيات الفضاء بشكل عشوائي ، فسيتم توزيع الصور الموجودة فيه بشكل عشوائي. ستكون أكثر كثافة في بعض أجزاء الفضاء أكثر من أجزاء أخرى.

دعنا نسمي بعض الفضاء المختار عشوائيا صورة مجردة. في هذا الفضاء المجرد ، سيكون هناك بالتأكيد مجموعات مضغوطة من النقاط. لذلك ، وفقًا لفرضية الانضغاط ، فإن مجموعة الكائنات التي تتوافق معها مجموعات مدمجة من النقاط في مساحة مجردة تسمى عادةً صورًا مجردة لمساحة معينة.

التدريب والتدريب الذاتي والتكيف والتدريب.

إذا كان من الممكن ملاحظة خاصية عالمية معينة لا تعتمد إما على طبيعة الصور أو على صورها ، ولكنها تحدد فقط القدرة على الفصل ، ثم إلى جانب المهمة المعتادة المتمثلة في تعليم التعرف باستخدام معلومات حول الانتماء لكل منها من تسلسل التدريب إلى صورة أو أخرى ، يمكن أن يكون من الأفضل طرح مشكلة تصنيف مختلفة - ما يسمى بمشكلة التعلم بدون معلم.

يمكن صياغة مهمة من هذا النوع على المستوى الوصفي على النحو التالي: يتم تقديم الكائنات إلى النظام في وقت واحد أو بالتتابع دون أي إشارة إلى انتمائها إلى الصور. يقوم جهاز الإدخال الخاص بالنظام بتعيين مجموعة من الكائنات على مجموعة من الصور ، وباستخدام بعض خصائص إمكانية فصل الصور المضمنة فيه مسبقًا ، يقوم بإجراء تصنيف مستقل لهذه الكائنات.

بعد هذه العملية من التعلم الذاتي ، يجب أن يكتسب النظام القدرة على التعرف ليس فقط على الأشياء المألوفة بالفعل (كائنات من تسلسل التدريب) ، ولكن أيضًا تلك التي لم يتم تقديمها من قبل. إن عملية التعلم الذاتي لنظام معين هي مثل هذه العملية ، ونتيجة لذلك يكتسب هذا النظام ، دون مساعدة المعلم ، القدرة على تطوير ردود الفعل نفسها على صور كائنات من نفس الصورة وردود فعل مختلفة على صور مختلفة من الصور.

يتمثل دور المعلم في هذه الحالة فقط في دفع النظام إلى بعض الخصائص الموضوعية التي هي نفسها لجميع الصور وتحديد القدرة على تقسيم مجموعة من الكائنات إلى صور.

اتضح أن هذه الخاصية الموضوعية هي خاصية انضغاط الصور. يحتوي الترتيب المتبادل للنقاط في المساحة المحددة بالفعل على معلومات حول كيفية تقسيم مجموعة النقاط. تحدد هذه المعلومات خاصية فصل الأنماط ، وهي كافية للتعلم الذاتي لنظام التعرف على الأنماط.

معظم خوارزميات التعلم الذاتي المعروفة قادرة على تحديد الصور المجردة فقط ، أي المجموعات المدمجة في مساحات معينة. يكمن الاختلاف بينهما في إضفاء الطابع الرسمي على مفهوم الاكتناز. ومع ذلك ، فإن هذا لا يقلل ، بل ويزيد في بعض الأحيان من قيمة خوارزميات التعلم الذاتي ، نظرًا لأن الصور نفسها لا يتم تحديدها مسبقًا من قبل أي شخص في كثير من الأحيان ، والمهمة هي تحديد مجموعات فرعية من الصور في مساحة معينة هي الصور.

مثال على مثل هذا البيان للمشكلة هو البحث الاجتماعي ، عندما يتم اختيار مجموعات من الناس وفقًا لمجموعة من الأسئلة. في هذا الفهم للمشكلة ، تولد خوارزميات التعلم الذاتي معلومات غير معروفة سابقًا حول وجود صور في مساحة معينة لم يكن لدى أي شخص أي فكرة عنها من قبل.

بالإضافة إلى ذلك ، فإن نتيجة التعلم الذاتي تميز مدى ملاءمة المساحة المختارة لمهمة تعلم التعرف المحددة. إذا كانت الصور المجردة المخصصة في فضاء التعلم الذاتي تتطابق مع الصور الحقيقية ، فقد تم اختيار المساحة بنجاح. كلما كانت الصور المجردة تختلف عن الصور الحقيقية ، زادت المساحة المختارة لمهمة معينة غير ملائمة.

عادةً ما يُطلق على التعلم عملية تطوير رد فعل معين في بعض الأنظمة على مجموعات من الإشارات الخارجية المتطابقة من خلال التأثير المتكرر على نظام التصحيح الخارجي. تحدد آلية إنشاء هذا التعديل بشكل شبه كامل خوارزمية التعلم.

يختلف التعلم الذاتي عن التعلم حيث لا يتم الإبلاغ هنا عن معلومات إضافية حول صحة رد الفعل على النظام.

التكيف هو عملية تغيير معايير وهيكل النظام ، وربما إجراءات التحكم ، بناءً على المعلومات الحالية من أجل تحقيق حالة معينة من النظام مع عدم اليقين الأولي وتغيير ظروف التشغيل.

التعلم هو عملية ، ونتيجة لذلك يكتسب النظام تدريجياً القدرة على الاستجابة بردود الفعل اللازمة لمجموعات معينة من التأثيرات الخارجية ، والتكيف هو تعديل معلمات وهيكل النظام من أجل تحقيق الجودة المطلوبة السيطرة تحت ظروف التغيرات المستمرة في الظروف الخارجية.


أنظمة التعرف على الكلام.

يعمل الكلام كوسيلة رئيسية للتواصل بين الناس وبالتالي يعتبر التواصل الكلامي من أهم مكونات نظام الذكاء الاصطناعي. التعرف على الكلام هو عملية تحويل الإشارة الصوتية الناتجة عن إخراج ميكروفون أو هاتف إلى سلسلة من الكلمات.

المهمة الأكثر صعوبة هي مهمة فهم الكلام ، والتي ترتبط بتحديد معنى الإشارة الصوتية. في هذه الحالة ، يعمل إخراج النظام الفرعي للتعرف على الكلام كمدخل للنظام الفرعي لفهم الكلام. يعد التعرف التلقائي على الكلام (أنظمة APP) أحد مجالات تقنيات معالجة اللغة الطبيعية.

يتم استخدام التعرف التلقائي على الكلام في أتمتة إدخال النصوص في أجهزة الكمبيوتر ، وفي تكوين استعلامات شفوية لقواعد البيانات أو أنظمة استرجاع المعلومات ، وفي تكوين أوامر شفهية لمختلف الأجهزة الذكية.

المفاهيم الأساسية لأنظمة التعرف على الكلام.

تتميز أنظمة التعرف على الكلام بالعديد من المعلمات.

أحد المعلمات الرئيسية هو خطأ التعرف على الكلمات (ORF). هذه المعلمة هي نسبة عدد الكلمات غير المعروفة إلى العدد الإجمالي للكلمات المنطوقة.

المعلمات الأخرى التي تميز أنظمة التعرف التلقائي على الكلام هي:

1) حجم القاموس ،

2) وضع الكلام ،

3) أسلوب الكلام ،

4) مجال الموضوع ،

5) إدمان المتحدثين ،

6) مستوى الضوضاء الصوتية ،

7) جودة قناة الإدخال.

اعتمادًا على حجم القاموس ، تنقسم أنظمة APP إلى ثلاث مجموعات:

بحجم قاموس صغير (حتى 100 كلمة) ،

بمتوسط ​​حجم القاموس (من 100 كلمة إلى عدة آلاف من الكلمات) ،

بحجم قاموس كبير (أكثر من 10000 كلمة).

يميز وضع الكلام طريقة نطق الكلمات والعبارات. هناك أنظمة للتعرف على الكلام المستمر والأنظمة التي تسمح بالتعرف على الكلمات المعزولة فقط. يتطلب وضع التعرف على الكلمات المعزول أن يتوقف مكبر الصوت مؤقتًا بين الكلمات.

وفقًا لأسلوب الكلام ، تنقسم أنظمة APP إلى مجموعتين: أنظمة الكلام الحتمية وأنظمة الكلام التلقائية.

في أنظمة التعرف على الكلام الحتمية ، يستنسخ المتحدث الكلام باتباع القواعد النحوية للغة. يتميز الكلام العفوي بانتهاكات القواعد النحوية ويصعب التعرف عليه.

اعتمادًا على مجال الموضوع ، هناك أنظمة APP تركز على التطبيق في مجالات متخصصة للغاية (على سبيل المثال ، الوصول إلى قواعد البيانات) وأنظمة APP ذات نطاق غير محدود. هذا الأخير يتطلب قدرًا كبيرًا من المفردات ويجب أن يوفر التعرف على الكلام التلقائي.

تعتمد العديد من أنظمة التعرف التلقائي على الكلام على مكبر الصوت. يتضمن هذا الضبط المسبق للنظام لخصائص نطق متحدث معين.

يتم تفسير تعقيد حل مشكلة التعرف على الكلام من خلال التباين العالي للإشارات الصوتية. يرجع هذا التباين إلى عدة أسباب:

أولاً ، التنفيذ المختلف للفونيمات - الوحدات الأساسية للنظام الصوتي للغة. يرجع التباين في تنفيذ الصوتيات إلى تأثير الأصوات المجاورة في تدفق الكلام. تسمى ظلال إدراك الصوتيات ، بسبب بيئة الصوت ، allophones.

ثانياً ، موقع وخصائص أجهزة الاستقبال الصوتية.

ثالثًا ، التغييرات في معايير خطاب المتحدث نفسه ، والتي ترجع إلى اختلاف الحالة العاطفية للمتحدث ، وسرعة خطابه.

يوضح الشكل المكونات الرئيسية لنظام التعرف على الكلام:

تدخل إشارة الكلام الرقمية إلى وحدة المعالجة المسبقة ، حيث يتم استخراج الميزات الضرورية للتعرف على الصوت. غالبًا ما يتم التعرف على الصوت باستخدام نماذج الشبكات العصبية الاصطناعية. تُستخدم وحدات الصوت المحددة لاحقًا للبحث عن سلسلة من الكلمات التي تتطابق بشكل أفضل مع إشارة إدخال الكلام.

يتم البحث عن سلسلة من الكلمات باستخدام نماذج صوتية ومعجمية ولغوية. يتم تحديد معلمات النموذج من بيانات التدريب بناءً على خوارزميات التعلم ذات الصلة.

توليف الكلام بالنص. مفاهيم أساسية

في كثير من الحالات ، يتطلب إنشاء أنظمة ذكاء اصطناعي مع عناصر اتصالها إخراج الرسائل في شكل كلام. يوضح الشكل مخطط كتلة لنظام ذكي للإجابة على الأسئلة بواجهة كلام:

الصورة 1.

خذ قطعة من المحاضرات من أوليغ

تأمل سمات النهج التجريبي في مثال التعرف على أجزاء من الكلام. تتمثل المهمة في تعيين تسميات لكلمات الجملة: الاسم ، والفعل ، وحرف الجر ، والصفة ، وما شابه ذلك. بالإضافة إلى ذلك ، من الضروري تحديد بعض الميزات الإضافية للأسماء والأفعال. على سبيل المثال ، بالنسبة للاسم هو رقم ، وبالنسبة للفعل فهو شكل. نقوم بإضفاء الطابع الرسمي على المهمة.

دعنا نمثل الجملة كسلسلة من الكلمات: W = w1 w2… wn ، حيث wn عبارة عن متغيرات عشوائية ، يتلقى كل منها إحدى القيم المحتملة التي تنتمي إلى قاموس اللغة. يمكن تمثيل تسلسل التسميات المخصصة لكلمات الجملة بالتسلسل X = x1 x2… xn ، حيث xn عبارة عن متغيرات عشوائية يتم تحديد قيمها في مجموعة الملصقات الممكنة.

ثم تتمثل مشكلة التعرف على جزء من الكلام في العثور على التسلسل الأكثر احتمالية للتسميات x1 ، x2 ، ... ، xn بالنظر إلى تسلسل الكلمات w1 ، w2 ، ... ، wn. بمعنى آخر ، من الضروري إيجاد مثل هذه السلسلة من الملصقات X * = x1 x2 ... xn التي توفر أقصى احتمال شرطي P (x1، x2،…، xn | w1 w2 .. wn).

دعونا نعيد كتابة الاحتمال الشرطي P (X | W) كـ P (X | W) = P (X، W) / P (W). نظرًا لأنه مطلوب للعثور على الحد الأقصى للاحتمال الشرطي P (X ، W) للمتغير X ، نحصل على X * = arg x max P (X، W). يمكن كتابة الاحتمال المشترك P (X، W) كمنتج للاحتمالات الشرطية: P (X، W) = المنتج فوق u-1 إلى n من P (xi | x1، ...، xi -1، w1، ...، wi -1) P (wi | x1، ...، xi -1، w1، ...، wi -1). يعد البحث المباشر عن الحد الأقصى لهذا التعبير مهمة صعبة ، حيث تصبح مساحة البحث كبيرة جدًا بالنسبة للقيم الكبيرة لـ n. لذلك ، يتم تقريب الاحتمالات المكتوبة في هذا المنتج باحتمالات شرطية أبسط: P (x i | x i -1) P (w i | w i -1). في هذه الحالة ، يُفترض أن قيمة التسمية x i مرتبطة فقط بالتسمية السابقة x i -1 ولا تعتمد على التسميات السابقة ، وأن احتمال كلمة w i يتم تحديده فقط من خلال التسمية الحالية x i. تسمى هذه الافتراضات ماركوفيان ، وتستخدم نظرية نماذج ماركوف لحل المشكلة. مع الأخذ في الاعتبار افتراضات ماركوف ، يمكننا أن نكتب:

X * = arg x1، ...، xn max П i = 1 n P (x i | x i -1) P (wi | wi-1)

حيث يتم تقدير الاحتمالات الشرطية على مجموعة من بيانات التدريب

يتم البحث عن سلسلة من الملصقات X * باستخدام خوارزمية البرمجة الديناميكية Viterbi. يمكن اعتبار خوارزمية Viterbi بمثابة متغير لخوارزمية البحث في الرسم البياني للحالة ، حيث تتوافق الرؤوس مع تسميات الكلمات.

بشكل مميز ، بالنسبة لأي قمة حالية ، فإن مجموعة التسميات الفرعية هي نفسها دائمًا. علاوة على ذلك ، بالنسبة لكل رأس طفل ، تتطابق أيضًا مجموعات الرؤوس الأم. يفسر ذلك حقيقة أن الانتقالات تتم على الرسم البياني للحالة ، مع مراعاة جميع المجموعات الممكنة من الملصقات. يوفر افتراض ماركوف تبسيطًا كبيرًا لمشكلة التعرف على أجزاء من الكلام مع الحفاظ على دقة عالية في تعيين تسميات للكلمات.

لذلك ، مع 200 علامة ، تبلغ دقة التخصيص حوالي 97٪. لفترة طويلة ، تم إجراء التحليل الإمبراطوري باستخدام قواعد نحوية خالية من السياق العشوائية. ومع ذلك ، لديهم عيب كبير. يكمن في حقيقة أنه يمكن تخصيص نفس الاحتمالات لتحليلات مختلفة. هذا يرجع إلى حقيقة أن احتمال الإعراب يتم تمثيله كمنتج لاحتمالات القواعد المتضمنة في التحليل. إذا تم استخدام قواعد مختلفة أثناء التحليل ، تتميز بنفس الاحتمالات ، فإن هذا يؤدي إلى ظهور المشكلة المشار إليها. يتم الحصول على أفضل النتائج من خلال القواعد النحوية التي تأخذ في الاعتبار مفردات اللغة.

في هذه الحالة ، تتضمن القواعد المعلومات المعجمية الضرورية التي توفر قيم احتمالية مختلفة لنفس القاعدة في بيئات معجمية مختلفة. يتماشى الإعراب الإمبراطوري مع التعرف على الأنماط أكثر من التحليل التقليدي بمعناه الكلاسيكي.

أظهرت الدراسات المقارنة أن دقة الاعراب الإمبراطوري لتطبيقات اللغة الطبيعية أعلى من دقة الإعراب التقليدي.

تعد طرق التعرف التلقائي على الأنماط وتنفيذها في أنظمة التعرف الضوئي على الأحرف (التعرف الضوئي على الأحرف - أنظمة التعرف الضوئي على الحروف) واحدة من أكثر تقنيات الذكاء الاصطناعي تقدمًا. في تطوير هذه التكنولوجيا ، يحتل العلماء الروس مناصب قيادية في العالم.

يُفهم نظام التعرف الضوئي على الحروف على أنه نظام للتعرف التلقائي على الصور باستخدام برامج خاصة لتصوير أحرف النص المطبوع أو المكتوب بخط اليد (على سبيل المثال ، يتم إدخاله في جهاز كمبيوتر من خلال ماسح ضوئي) وتحويله إلى تنسيق مناسب للمعالجة بواسطة معالجات النصوص ومحرري النصوص ، إلخ.

يتم أحيانًا فك تشفير الاختصار OCR على أنه قارئ الأحرف البصري - جهاز للتعرف البصري على الأحرف أو القراءة التلقائية للنص. حاليًا ، تعالج هذه الأجهزة المستخدمة في الصناعة ما يصل إلى 100000 مستند يوميًا.

يتضمن الاستخدام الصناعي إدخال مستندات ذات جودة جيدة إلى متوسطة - وهي معالجة نماذج التعداد والإقرارات الضريبية وما إلى ذلك.

ندرج ميزات مجال الموضوع المهمة من وجهة نظر أنظمة التعرف الضوئي على الحروف:

  • الخط والحجم مجموعة متنوعة من الشخصيات ؛
  • تشوهات في صور الرموز (فواصل في صور الرموز) ؛
  • تشوهات أثناء المسح.
  • الادراج الأجنبية في الصور ؛
  • مزيج من أجزاء النص بلغات مختلفة ؛
  • مجموعة متنوعة من فئات الشخصيات التي لا يمكن التعرف عليها إلا بمعلومات سياقية إضافية.

القراءة التلقائية للنصوص المطبوعة والمكتوبة بخط اليد هي حالة خاصة للإدراك البصري التلقائي للصور المعقدة. أظهرت العديد من الدراسات أنه من أجل حل هذه المشكلة بشكل كامل ، فإن الاعتراف الفكري ، أي "الاعتراف بالفهم" ضروري.

هناك ثلاثة مبادئ تقوم عليها جميع أنظمة التعرف الضوئي على الحروف.

  • 1. مبدأ سلامة الصورة. في الكائن قيد الدراسة ، توجد دائمًا أجزاء مهمة توجد بينها علاقات. يتم تفسير نتائج العمليات المحلية مع أجزاء من الصورة بشكل مشترك فقط في عملية تفسير الأجزاء المتكاملة والصورة بأكملها.
  • 2. مبدأ العزيمة. التعرف هو عملية هادفة لتوليد واختبار الفرضيات (معرفة ما هو متوقع من كائن).
  • 3. مبدأ القدرة على التكيف. يجب أن يكون نظام التعرف قادرًا على التعلم الذاتي.

أنظمة OCR الروسية الرائدة: FineReader؛ مخطوطة FineReader النموذج CunieForm (التقنيات المعرفية) ، الأشكال المعرفية (التقنيات المعرفية).

يتم إنتاج نظام FineReader من قبل ABBYY ، التي تأسست في عام 1989. ABBYY تتطور في اتجاهين: الرؤية الآلية واللغويات التطبيقية. الاتجاه الاستراتيجي للبحث العلمي والتطوير هو الجانب اللغوي الطبيعي للتقنيات في مجال رؤية الآلة والذكاء الاصطناعي واللغويات التطبيقية.

CuneiForm GOLD لنظام التشغيل Windows هو أول نظام التعرف الضوئي على الحروف ذكي التعلم الذاتي في العالم ، باستخدام أحدث تقنيات التعرف على النص التكيفي ، ويدعم العديد من اللغات. لكل لغة ، يتم توفير قاموس للتحقق من السياق وتحسين جودة نتائج التعرف. يتعرف على أي محارف وخطوط مطبوعة على الآلة الكاتبة واردة من الطابعات ، باستثناء النصوص المزخرفة والمكتوبة بخط اليد ، وكذلك النصوص منخفضة الجودة للغاية.

خصائص أنظمة التعرف على الأنماط. من بين تقنيات OSL ، تعتبر التقنيات الخاصة لحل فئات معينة من مشاكل التعرف التلقائي على الأنماط ذات أهمية كبيرة:

  • البحث عن الناس بالصور ؛
  • البحث عن الرواسب المعدنية والتنبؤ بالطقس بناءً على التصوير الجوي وصور الأقمار الصناعية في نطاقات مختلفة من الإشعاع الضوئي ؛
  • تجميع الخرائط الجغرافية بناءً على المعلومات الأولية المستخدمة في المهمة السابقة ؛
  • تحليل بصمات ورسومات قزحية العين في الطب الشرعي والأمن والأنظمة الطبية.

في مرحلة إعداد المعلومات ومعالجتها ، خاصةً عند حوسبة مؤسسة ، وأتمتة المحاسبة ، تنشأ المهمة عن إدخال كمية كبيرة من المعلومات النصية والرسوماتية في جهاز الكمبيوتر. الأجهزة الرئيسية لإدخال المعلومات الرسومية هي: ماسح ضوئي ومودم فاكس وكاميرا رقمية في كثير من الأحيان. بالإضافة إلى ذلك ، باستخدام برامج التعرف على النص الضوئي ، يمكنك أيضًا إدخال (رقمنة) معلومات النص في جهاز الكمبيوتر. تتيح أنظمة البرامج والأجهزة الحديثة إمكانية أتمتة إدخال كميات كبيرة من المعلومات إلى جهاز الكمبيوتر ، باستخدام ، على سبيل المثال ، ماسح ضوئي للشبكة والتعرف على النص المتوازي على العديد من أجهزة الكمبيوتر في وقت واحد.

تعمل معظم برامج التعرف الضوئي على الحروف مع صورة نقطية يتم استلامها من خلال مودم فاكس أو ماسح ضوئي أو كاميرا رقمية أو أي جهاز آخر. في المرحلة الأولى ، يجب أن يقسم نظام OSA الصفحة إلى كتل نصية ، بناءً على ميزات المحاذاة اليمنى واليسرى ووجود عدة أعمدة. ثم يتم تقسيم الكتلة المعترف بها إلى أسطر. على الرغم من البساطة الظاهرة ، فهذه ليست مهمة واضحة ، حيث إن تشويه صورة الصفحة أو أجزاءها عند طيها أمر لا مفر منه عمليًا. حتى الميل الطفيف يتسبب في أن تكون الحافة اليسرى لخط ما أقل من الحافة اليمنى للخط التالي ، خاصة عندما يكون تباعد الأسطر صغيرًا. نتيجة لذلك ، هناك مشكلة في تحديد الخط الذي ينتمي إليه هذا الجزء أو ذاك من الصورة. على سبيل المثال ، للرسائل

ثم يتم تقسيم الخطوط إلى مناطق متجاورة من الصورة تتوافق مع الأحرف الفردية ؛ تضع خوارزمية التعرف افتراضات حول تطابق هذه المناطق مع الأحرف ، ثم يتم تحديد كل حرف ، ونتيجة لذلك يتم استعادة الصفحة بأحرف نصية ، وكقاعدة عامة ، بتنسيق معين. يمكن أن تحقق أنظمة التعرف الضوئي على الحروف أفضل دقة في التعرف - أكثر من 99.9٪ للصور النقية المكونة من خطوط عادية. للوهلة الأولى ، تبدو دقة التعرف هذه مثالية ، لكن معدل الخطأ لا يزال محبطًا ، لأنه إذا كان هناك ما يقرب من 1500 حرف لكل صفحة ، فحتى مع معدل نجاح التعرف بنسبة 99.9٪ ، هناك خطأ واحد أو خطأين في الصفحة. في مثل هذه الحالات ، يجب عليك استخدام طريقة التحقق من القاموس ، أي إذا كانت كلمة معينة غير موجودة في قاموس النظام ، فسيحاول البحث عن كلمة مماثلة وفقًا لقواعد خاصة. لكن هذا لا يزال لا يسمح بتصحيح 100٪ من الأخطاء ويتطلب تحكمًا بشريًا في النتائج.

عادة ما تكون النصوص التي يتم العثور عليها في الحياة الواقعية بعيدة عن الكمال ، وغالبًا ما تكون نسبة أخطاء التعرف على النصوص "غير النقية" عالية بشكل غير مقبول. الصور المتسخة هي المشكلة الأكثر وضوحًا لأنه حتى اللطخات الصغيرة يمكن أن تحجب تحديد أجزاء من الشخصية أو تحول بعضها إلى أخرى. تكمن المشكلة أيضًا في المسح غير الدقيق المرتبط بـ "العامل البشري" ، حيث إن العامل الجالس في الماسح الضوئي ببساطة غير قادر على سلاسة كل صفحة ممسوحة ضوئيًا ومواءمتها بدقة مع حواف الماسح الضوئي. إذا تم نسخ المستند ضوئيًا ، فغالبًا ما تكون هناك فواصل ودمج للأحرف. يمكن لأي من هذه التأثيرات أن يتسبب في خطأ النظام لأن بعض أنظمة OSD تفترض أن المنطقة المجاورة للصورة يجب أن تكون حرفًا واحدًا. تنشئ الصفحة الخارجة عن الحدود أو الصفحة المنحرفة صورًا منحرفة قليلاً يمكن أن يربكها نظام OSA.

يعمل برنامج نظام OSL عادةً مع صورة نقطية كبيرة للصفحة المستلمة من الماسح الضوئي. يتم الحصول على صور بدرجة دقة قياسية عن طريق المسح بدقة تبلغ 9600 ص / يوم. تشغل صورة ورقة مقاس A4 بهذه الدقة حوالي 1 ميغابايت من الذاكرة.

الغرض الرئيسي من أنظمة التعرف الضوئي على الحروف هو تحليل المعلومات النقطية (الحرف الممسوح ضوئيًا) وتعيين حرف مطابق لجزء الصورة. بعد اكتمال عملية التعرف ، يجب أن تكون أنظمة التعرف الضوئي على الحروف قادرة على الحفاظ على تنسيق المستندات المصدر ، وتعيين سمة فقرة في المكان المناسب ، وحفظ الجداول ، والرسومات ، وما إلى ذلك. تدعم برامج التعرف الحديثة جميع تنسيقات النصوص والرسومات المعروفة وتنسيقات جداول البيانات ، وكذلك HTML و PDF.

العمل مع أنظمة التعرف الضوئي على الحروف ، كقاعدة عامة ، يجب ألا يسبب أي صعوبات معينة. تحتوي معظم هذه الأنظمة على أبسط وضع تلقائي "المسح والتعرف" (المسح والقراءة) ، كما أنها تدعم وضع التعرف على الصور من الملفات. ومع ذلك ، من أجل تحقيق أفضل النتائج الممكنة لنظام معين ، فمن المستحسن (وغالبًا ما يكون ضروريًا) ضبطه يدويًا مسبقًا لنوع معين من النص وتخطيط الورق ذي الرأسية وجودة الورق. تؤدي الصفحة الخارجة عن الحدود أو المنحرفة إلى إنشاء صور شخصية مشوهة قليلاً يمكن أن يتم الخلط بينها وبين نظام التعرف الضوئي على الحروف.

عند العمل باستخدام نظام التعرف الضوئي على الحروف ، من المهم جدًا اختيار لغة التعرف ونوع المواد المراد التعرف عليها (آلة كاتبة ، فاكس ، طابعة نقطية ، صحيفة ، إلخ) ، بالإضافة إلى سهولة واجهة المستخدم. عند التعرف على النصوص التي تُستخدم فيها عدة لغات ، تعتمد كفاءة التعرف على قدرة نظام التعرف الضوئي على الحروف على تكوين مجموعات من اللغات. في الوقت نفسه ، تحتوي بعض الأنظمة بالفعل على مجموعات من اللغات الأكثر استخدامًا ، مثل الروسية والإنجليزية.

في الوقت الحالي ، يوجد عدد كبير من البرامج التي تدعم التعرف على النص كأحد الاحتمالات. الرائد في هذا المجال هو نظام FineReader. يحتوي الإصدار الأخير من البرنامج (6.0) الآن على أدوات لتطوير أنظمة جديدة تعتمد على تقنية FineReader 6.0. تشتمل عائلة FineReader 6.0 على: FineReader 6.0 Professional و FineReader 6.0 Corporate Edition و FineReader Scripting Edition 6.0 و FineReader Engine 6.0. نظام FineReader 6.0 ، بالإضافة إلى معرفة عدد كبير من تنسيقات الحفظ ، بما في ذلك PDF ، لديه القدرة على التعرف مباشرة من ملفات PDF. تتيح لك تقنية التصفية الذكية للخلفية الجديدة (التصفية الذكية للخلفية) تصفية المعلومات حول نسيج المستند وضوضاء خلفية الصورة: في بعض الأحيان يتم استخدام خلفية رمادية أو ملونة لتمييز النص في المستند. هذا لا يمنع الشخص من القراءة ، لكن خوارزميات التعرف على النص التقليدية تواجه صعوبات خطيرة عند التعامل مع الحروف الموجودة أعلى هذه الخلفية. يمكن لـ FineReader اكتشاف المناطق التي تحتوي على مثل هذا النص عن طريق فصل النص عن خلفية المستند ، والعثور على النقاط الأصغر من حجم معين ، وإزالتها. في الوقت نفسه ، يتم الحفاظ على معالم الحروف ، بحيث لا تؤدي نقاط الخلفية القريبة من هذه الخطوط إلى حدوث تداخل يمكن أن يقلل من جودة التعرف على النص.

باستخدام إمكانيات برامج التخطيط الحديثة ، غالبًا ما ينشئ المصممون كائنات ذات شكل معقد ، مثل التفاف نص متعدد الأعمدة حول صورة غير مستطيلة. يدعم برنامج FineReader 6.0 التعرف على هذه الأشياء وحفظها في ملفات MS Word. سيتم الآن إعادة إنتاج مستندات التخطيط المعقدة بدقة في محرر النصوص هذا. يتم التعرف على الجداول المتساوية بأقصى قدر من الدقة ، مع الحفاظ على جميع إمكانيات التحرير.

ABBYY FormReader هو أحد برامج التعرف على ABBYY استنادًا إلى محرك ABBYY FineReader. تم تصميم هذا البرنامج للتعرف على النماذج التي يمكن ملؤها يدويًا ومعالجتها. يمكن لبرنامج ABBYY FormReader معالجة النماذج بتخطيط ثابت تمامًا مثل النماذج التي يمكن تغيير هيكلها. تم استخدام تقنية ABBYY FlexiForm الجديدة للتعرف عليها.

رخصت الشركات المصنعة للبرامج الرائدة تكنولوجيا المعلومات الروسية لاستخدامها مع منتجاتها. حزم البرامج الشائعة Corel Draw (Corel Corporation) و FaxLine / OCR & Business Card Wizard (Inzer Corporation) والعديد من البرامج الأخرى تحتوي على مكتبة CuneiForm OCR مضمنة. أصبح هذا البرنامج أول نظام OCR في روسيا يحصل على شعار MS Windows المتوافق.

يعد Readiris Pro 7 برنامجًا احترافيًا للتعرف على النصوص. وفقًا للمصنعين ، يختلف نظام OCR هذا عن نظائره بأعلى دقة في تحويل المستندات المطبوعة العادية (اليومية) ، مثل الرسائل والفاكسات ومقالات المجلات ومقتطفات الصحف إلى كائنات قابلة للتحرير (بما في ذلك ملفات PDF). المزايا الرئيسية للبرنامج هي: القدرة على التعرف بشكل أو بآخر على الصور المضغوطة بدقة "إلى أقصى حد" (مع أقصى قدر من فقدان الجودة) باستخدام طريقة تنسيق JPEG ، ودعم الكاميرات الرقمية والاكتشاف التلقائي لاتجاه الصفحة ، ودعم ما يصل إلى 92 لغة (بما في ذلك الروسية).

OmniPage 11 هو أحد منتجات ScanSoft. عادةً ما يتم إرفاق إصدار محدود من هذا البرنامج (OmniPage 11 Limited Edition ، OmniPage Lite) مع ماسحات ضوئية جديدة (في أوروبا والولايات المتحدة). يدعي المطورون أن برنامجهم يتعرف على المستندات المطبوعة بدقة تقارب 100٪ ، ويستعيد تنسيقها ، بما في ذلك الأعمدة والجداول والواصلة (بما في ذلك الواصلة لأجزاء من الكلمات) والعناوين وعناوين الفصول والتوقيعات وأرقام الصفحات والحواشي السفلية والفقرات والقوائم المرقمة والخطوط الحمراء والرسوم البيانية والصور. من الممكن الحفظ في Microsoft Office و PDF و 20 تنسيقًا آخر والتعرف عليها من ملفات PDF وتحريرها بهذا التنسيق. يسمح لك نظام الذكاء الاصطناعي باكتشاف الأخطاء وتصحيحها تلقائيًا بعد التصحيح اليدوي الأول. تتيح لك وحدة البرامج الجديدة المطورة خصيصًا "Dcspeckle" التعرف على المستندات ذات الجودة المنخفضة (الفاكسات والنسخ ونسخ النسخ وما إلى ذلك). يمتاز البرنامج بقدرته على التعرف على النص الملون وتصحيحه بالصوت. يوجد إصدار من OmniPage أيضًا لأجهزة كمبيوتر Macintosh.

  • سم.: Bashmakov A. I. ، Bashmakov I. A.تقنيات المعلومات الذكية.

إرسال عملك الجيد في قاعدة المعرفة أمر بسيط. استخدم النموذج أدناه

سيكون الطلاب وطلاب الدراسات العليا والعلماء الشباب الذين يستخدمون قاعدة المعرفة في دراساتهم وعملهم ممتنين جدًا لك.

نشر على http://www.allbest.ru/

وزارة التربية والتعليم والعلوم في الاتحاد الروسي

جامعة ولاية نوفوسيبيرسك للاقتصاد والإدارة "NINH"

كلية تكنولوجيا المعلومات

قسم تكنولوجيا المعلومات التطبيقية

الانضباط المنطق الضبابي والشبكات العصبية

التعرف على الأنماط

الاتجاه: المعلوماتية التجارية (الأعمال الإلكترونية)

الاسم الكامل للطالب: إيكاترينا فيتاليفنا مازور

فحص بواسطة: بافلوفا آنا إيلاريونوفنا

نوفوسيبيرسك 2016

  • مقدمة
  • 1. مفهوم الاعتراف
    • 1.1 تاريخ التنمية
    • 1.2 تصنيف طرق التعرف على الأنماط
  • 2. طرق التعرف على الأنماط
  • 3. الخصائص العامة لمشاكل التعرف على الأنماط وأنواعها
  • 4. مشاكل وآفاق تطوير التعرف على الأنماط
    • 4.1 تطبيق التعرف على الأنماط في الممارسة
  • خاتمة

مقدمة

لفترة طويلة ، تم النظر في مشكلة التعرف على الأنماط فقط من وجهة نظر بيولوجية. في الوقت نفسه ، خضعت الخصائص النوعية فقط للملاحظات ، والتي لم تسمح بوصف آلية التشغيل.

المفهوم الذي قدمه N. Wiener في بداية القرن العشرين علم التحكم الذاتي(علم القوانين العامة لعمليات التحكم ونقل المعلومات في الآلات والكائنات الحية والمجتمع) ، سمح بإدخال الأساليب الكمية في مسائل الاعتراف. أي لتقديم هذه العملية (في الواقع - ظاهرة طبيعية) بالطرق الرياضية.

تعد نظرية التعرف على الأنماط أحد الأقسام الرئيسية في علم التحكم الآلي ، من الناحيتين النظرية والتطبيقية. وبالتالي ، فإن أتمتة بعض العمليات تتضمن إنشاء أجهزة قادرة على الاستجابة لتغير خصائص البيئة الخارجية مع عدد معين من ردود الفعل الإيجابية.

أساس حل مشاكل هذا المستوى هو نتائج النظرية الكلاسيكية للحلول الإحصائية. في إطاره ، تم إنشاء خوارزميات لتحديد الفئة التي يمكن تخصيص كائن يمكن التعرف عليه.

الغرض من هذا العمل هو التعرف على مفاهيم نظرية التعرف على الأنماط: الكشف عن التعريفات الرئيسية ، ودراسة تاريخ الحدوث ، وإبراز الأساليب والمبادئ الرئيسية للنظرية.

تكمن أهمية الموضوع في حقيقة أن التعرف على الأنماط في الوقت الحالي هو أحد المجالات الرائدة في علم التحكم الآلي. لذلك ، في السنوات الأخيرة ، تم استخدامه بشكل متزايد: فهو يبسط تفاعل الشخص مع جهاز كمبيوتر ويخلق المتطلبات الأساسية لاستخدام أنظمة الذكاء الاصطناعي المختلفة.

تطبيق التعرف على الصور

1. مفهوم الاعتراف

لفترة طويلة ، جذبت مشكلة التعرف انتباه العلماء فقط في مجال الرياضيات التطبيقية. نتيجة لذلك ، تم إنشاء أعمال R. Fischer في 20 ثانية، أدى إلى تكوين تحليل مميز - أحد أقسام نظرية وممارسة التعرف على الأنماط. في 40 ثانيةوضع A.N.Kolmogorov و A. Ya. Khinchin هدف فصل مزيج من توزيعين. و في 50-60 ثانيةسنوات القرن العشرين ، على أساس عدد كبير من الأعمال ، ظهرت نظرية القرارات الإحصائية. في إطار علم التحكم الآلي ، بدأ اتجاه جديد في التبلور ، مرتبطًا بتطوير الأسس النظرية والتنفيذ العملي للآليات ، فضلاً عن الأنظمة المصممة للتعرف على الأشياء والعمليات. النظام الجديد كان يسمى "التعرف على الأنماط".

التعرف على الأنماط(الكائنات) هي مهمة تحديد كائن من خلال صورته (التعرف البصري) أو التسجيل الصوتي (التعرف الصوتي) أو أي خصائص أخرى. صورة- هذا تجميع تصنيف يسمح لك بدمج مجموعة من الكائنات وفقًا لبعض المعايير. تتميز الصور بخاصية مميزة تتجلى في حقيقة أن التعرف على عدد محدود من الظواهر من مجموعة واحدة يجعل من الممكن التعرف على عدد كبير من ممثليها. في الصياغة الكلاسيكية لمشكلة التعرف ، يتم تقسيم المجموعة إلى أجزاء.

أحد التعريفات الأساسية هو أيضًا المفهوم مجموعات.في الكمبيوتر ، المجموعة هي مجموعة من العناصر غير المتكررة من نفس النوع. يعني "عدم التكرار" أن العنصر موجود في المجموعة أم لا. تتضمن المجموعة العامة جميع العناصر الممكنة ، ولا تحتوي المجموعة الفارغة على أي عنصر.

تسمى طريقة تعيين عنصر لبعض الصور قاعدة القرار.مفهوم آخر مهم هو المقاييس- يحدد المسافة بين عناصر المجموعة. كلما كانت هذه المسافة أصغر ، زادت تشابه الكائنات (الرموز والأصوات وما إلى ذلك) التي نتعرف عليها. بشكل افتراضي ، يتم تحديد العناصر كمجموعة من الأرقام ، ويتم تحديد المقياس كنوع من الوظائف. تعتمد كفاءة البرنامج على اختيار تمثيل الصورة وتنفيذ المقياس: نفس خوارزمية التعرف بمقاييس مختلفة سترتكب أخطاء بترددات مختلفة.

التعلمعادة ما تسمى عملية التطوير في بعض الأنظمة برد فعل معين لعوامل الإشارات الخارجية المماثلة من خلال تأثيرها المتكرر على النظام. التعلم الذاتييختلف عن التدريب حيث لا يتم إبلاغ النظام بمعلومات إضافية حول التفاعل.

أمثلة على مشاكل التعرف على الأنماط هي:

التعرف على الحروف

التعرف على الباركود

التعرف على لوحات الترخيص.

التعرف على الوجوه والبيانات البيومترية الأخرى ؛

التعرف على الكلام ، إلخ.

1.1 تاريخ تطوير

بحلول منتصف الخمسينيات من القرن الماضي ، ألقى R. Penrose بظلال من الشك على نموذج الشبكة العصبية للدماغ ، مشيرًا إلى الدور الأساسي لتأثيرات ميكانيكا الكم في عملها. بناءً على ذلك ، طور F. Rosenblatt نموذج تعلم التعرف على الأنماط المرئية يسمى Perceptron.

صورة1 - تخطيطي من Perceptron

علاوة على ذلك ، تم اختراع التعميمات المختلفة للإدراك البصري ، وكانت وظيفة الخلايا العصبية معقدة: لا تستطيع الخلايا العصبية فقط مضاعفة أرقام الإدخال ومقارنة النتيجة بقيم العتبة ، ولكن أيضًا تطبيق وظائف أكثر تعقيدًا عليها. يوضح الشكل 2 أحد هذه المضاعفات:

أرز. 2 رسم تخطيطي للشبكة العصبية.

بالإضافة إلى ذلك ، يمكن أن تكون طوبولوجيا الشبكة العصبية أكثر تعقيدًا. على سبيل المثال ، مثل هذا:

الشكل 3 - رسم تخطيطي لشبكة روزنبلات العصبية.

جعلت الشبكات العصبية ، كونها كائنًا معقدًا للتحليل الرياضي ، مع استخدامها الصحيح ، من الممكن العثور على قوانين بيانات بسيطة للغاية. لكن هذه الميزة هي أيضًا مصدر للأخطاء المحتملة. تفسر صعوبة التحليل ، في الحالة العامة ، فقط من خلال الهيكل المعقد ، ولكن نتيجة لذلك ، من خلال الاحتمالات التي لا تنضب عمليًا لتعميم مجموعة متنوعة من الانتظامات.

1.2 تصنيفطرقالتعرف علىالصور

كما أشرنا بالفعل ، فإن التعرف على الأنماط هو مهمة إنشاء علاقات تكافؤ بين نماذج صور معينة للأشياء في العالم الحقيقي أو المثالي.

تحدد هذه العلاقات انتماء الأشياء التي يمكن التعرف عليها إلى بعض الفئات ، والتي تعتبر وحدات مستقلة مستقلة.

عند إنشاء خوارزميات التعرف ، يمكن تحديد هذه الفئات بواسطة الباحث الذي يستخدم أفكاره الخاصة أو يستخدم معلومات إضافية حول تشابه أو اختلاف العناصر في سياق مهمة معينة. في هذه الحالة يتحدث المرء عن "التعرف على المعلم". في مكان آخر ، أي عندما يحل نظام آلي مشكلة تصنيف دون تضمين معلومات إضافية ، يتحدث المرء عن "التعرف غير الخاضع للإشراف".

في أعمال V.A. يقدم Duke مراجعة أكاديمية لطرق الاعتراف ويستخدم طريقتين رئيسيتين لتمثيل المعرفة:

الأبعاد (في شكل رسم تخطيطي للعلاقات بين السمات) ؛

موسع بمساعدة حقائق محددة (أشياء ، أمثلة).

التمثيل المكثف يلتقط الأنماط التي تشرح بنية البيانات. فيما يتعلق بمهام التشخيص ، يتمثل هذا التثبيت في تحديد العمليات على ميزات الكائنات التي تؤدي إلى النتيجة المرجوة. يتم تنفيذ التمثيلات ذات الأبعاد من خلال العمليات على القيم ولا تتضمن عمليات على كائنات محددة.

في المقابل ، ترتبط التمثيلات الموسعة للمعرفة بوصف وتثبيت كائنات محددة من مجال الموضوع ويتم تنفيذها في عمليات ، تكون عناصرها كائنات كنظم مستقلة.

وبالتالي ، فإن تصنيف طرق التعرف التي اقترحها V.A. ديوك ، تم وضع القواعد الأساسية التي تكمن وراء طريقة الإدراك البشرية من حيث المبدأ. يؤدي هذا إلى وضع هذا التقسيم إلى فئات في وضع خاص مقارنة بالتصنيفات الأخرى الأقل شهرة ، والتي تبدو ، في ظل هذه الخلفية ، مصطنعة وغير مكتملة.

2. طرقالتعرف على الأنماط

طريقة التكرار.في هذه الطريقة ، يتم إجراء مقارنة مع قاعدة بيانات معينة ، حيث توجد خيارات مختلفة لتعديل العرض لكل كائن. على سبيل المثال ، بالنسبة للتعرف الضوئي على الصور ، يمكنك تطبيق طريقة التكرار بزوايا أو مقاييس مختلفة ، وإزاحات ، وتشوهات ، وما إلى ذلك. بالنسبة للأحرف ، يمكنك تكرار الخط أو خصائصه. في حالة التعرف على أنماط الصوت ، توجد مقارنة مع بعض الأنماط المعروفة (كلمة يتكلمها كثير من الناس). علاوة على ذلك ، يتم إجراء تحليل أعمق لخصائص الصورة. في حالة التعرف البصري ، قد يكون هذا هو تعريف الخصائص الهندسية. تخضع عينة الصوت في هذه الحالة لتحليل التردد والسعة.

الطريقة التالية هي استخدام الشبكات العصبية الاصطناعية(INS). يتطلب إما عددًا كبيرًا من الأمثلة لمهمة التعرف ، أو بنية شبكة عصبية خاصة تأخذ في الاعتبار تفاصيل هذه المهمة. ولكن ، مع ذلك ، تتميز هذه الطريقة بكفاءة وإنتاجية عالية.

طرق تستند إلى تقديرات كثافات توزيع قيم المعالم. اقتبس من النظرية الكلاسيكية للقرارات الإحصائية ، حيث تعتبر كائنات الدراسة بمثابة تحقيق لمتغير عشوائي متعدد الأبعاد موزع في فضاء الميزة وفقًا لبعض القوانين. وهي تستند إلى مخطط صنع القرار Bayesian ، الذي يناشد الاحتمالات الأولية للكائنات التي تنتمي إلى فئة معينة وكثافة توزيع الميزة الشرطية.

ترتبط مجموعة الطرق التي تعتمد على تقدير كثافات توزيع قيم السمات ارتباطًا مباشرًا بطرق التحليل التمييزي. يعتبر نهج بايز في اتخاذ القرار من أكثر الأساليب البارامترية تطورًا في الإحصاء الحديث ، حيث يُعتبر التعبير التحليلي لقانون التوزيع (القانون العادي) معروفًا وعددًا صغيرًا فقط من المعلمات (المتجهات المتوسطة ومصفوفات التغاير) ) تحتاج إلى تقدير. تعتبر الصعوبات الرئيسية في تطبيق هذه الطريقة هي الحاجة إلى تذكر عينة التدريب بأكملها لحساب تقديرات الكثافة والحساسية العالية لعينة التدريب.

طرق مبنية على افتراضات حول فئة وظائف القرار. في هذه المجموعة ، يُعتبر نوع وظيفة القرار معروفًا ويتم تقديم وظيفتها النوعية. بناءً على هذه الوظيفة ، تم العثور على التقريب الأمثل لوظيفة القرار من تسلسل التدريب. عادة ما ترتبط جودة قاعدة القرار الوظيفية بخطأ. الميزة الرئيسية للطريقة هي وضوح الصياغة الرياضية لمشكلة التعرف. إن إمكانية استخراج معرفة جديدة حول طبيعة الكائن ، ولا سيما المعرفة حول آليات التفاعل بين السمات ، محدودة بشكل أساسي هنا ببنية معينة من التفاعل ، ثابت في الشكل المختار لوظائف القرار.

طريقة مقارنة النموذج الأولي. هذه هي أسهل طريقة للتعرف الموسع في الممارسة. يتم تطبيقه عندما يتم عرض الفئات التي يمكن التعرف عليها كفئات هندسية مضغوطة. ثم يتم اختيار مركز التجميع الهندسي (أو الكائن الأقرب إلى المركز) كنقطة النموذج الأولي.

لتصنيف كائن غير محدد ، يتم العثور على النموذج الأولي الأقرب إليه ، وينتمي الكائن إلى نفس الفئة التي ينتمي إليها. من الواضح أنه لا توجد صور معممة بهذه الطريقة. يمكن استخدام أنواع مختلفة من المسافات كمقياس.

ك طريقة الجار الأقرب. تكمن الطريقة في حقيقة أنه عند تصنيف كائن غير معروف ، يتم العثور على رقم معين (k) لأقرب مساحة ميزة هندسية لأقرب جيران آخرين مع الانتماء المعروف بالفعل إلى فئة. يتم اتخاذ قرار تعيين كائن غير معروف من خلال تحليل المعلومات حول أقرب جيرانه. تعد الحاجة إلى تقليل عدد العناصر في عينة التدريب (السوابق التشخيصية) من عيوب هذه الطريقة ، لأن هذا يقلل من تمثيل عينة التدريب.

استنادًا إلى حقيقة أن خوارزميات التعرف المختلفة تتصرف بشكل مختلف في نفس العينة ، فإن السؤال الذي يطرح نفسه هو قاعدة القرار التركيبية التي تستخدم نقاط القوة في جميع الخوارزميات. لهذا ، هناك طريقة تركيبية أو مجموعات من قواعد القرار التي تجمع بين الجوانب الأكثر إيجابية لكل طريقة من الطرق.

في ختام مراجعة طرق التعرف ، نقدم جوهر ما سبق في جدول ملخص ، مضيفًا بعض الطرق الأخرى المستخدمة في الممارسة.

الجدول 1. جدول تصنيف طرق التعرف ومقارنة مجالات تطبيقها والقيود

تصنيف طرق التعرف

منطقة التطبيق

القيود (العيوب)

طرق التعرف المكثفة

طرق تعتمد على تقديرات الكثافة

مشاكل معروفة التوزيع (عادي) ، الحاجة إلى جمع إحصائيات كبيرة

الحاجة إلى تعداد مجموعة التدريب بأكملها أثناء التعرف ، والحساسية العالية لعدم التمثيل لمجموعة التدريب والتحف

الأساليب القائمة على الافتراض

يجب أن تكون الفصول الدراسية قابلة للفصل جيدًا

يجب أن يكون شكل وظيفة القرار معروفًا مسبقًا. استحالة مراعاة المعرفة الجديدة حول العلاقات المتبادلة بين السمات

طرق منطقية

مشاكل صغيرة الحجم

عند اختيار قواعد القرار المنطقي ، من الضروري إجراء تعداد كامل. كثافة اليد العاملة العالية

الطرق اللغوية

مهمة تحديد القواعد لمجموعة معينة من العبارات (أوصاف الأشياء) يصعب إضفاء الطابع الرسمي عليها. مشاكل نظرية لم تحل

طرق التعرف الموسعة

طريقة مقارنة النموذج الأولي

مشاكل البعد الصغير للمساحة المميزة

اعتماد كبير لنتائج التصنيف على المقياس. المقياس الأمثل غير معروف

ك طريقة الجار الأقرب

اعتماد كبير لنتائج التصنيف على المقياس. الحاجة إلى حصر كامل لعينة التدريب أثناء التعرف. التعقيد الحسابي

خوارزميات حساب الدرجات (ABO)

مشاكل صغيرة الحجم من حيث عدد الطبقات والميزات

اعتماد نتائج التصنيف على المقياس. الحاجة إلى حصر كامل لعينة التدريب أثناء التعرف. درجة تعقيد التقنية العالية للطريقة

قواعد القرار الجماعي (CRC) هي طريقة تركيبية.

مشاكل صغيرة الحجم من حيث عدد الطبقات والميزات

تعقيد تقني عالٍ جدًا للطريقة ، وعدد المشكلات النظرية التي لم يتم حلها ، سواء في تحديد مجالات اختصاص طرق معينة ، أو في الأساليب الخاصة نفسها

3. الخصائص العامة لمشاكل التعرف على الأنماط وأنواعها

يظهر الهيكل العام لنظام التعرف ومراحلها في الشكل 4:

الشكل 4 - هيكل نظام التعرف

مهام التعرف لها المراحل المميزة التالية:

تحويل البيانات الأولية إلى شكل مناسب للتعرف عليها ؛

الاعتراف (يشير إلى أن الكائن ينتمي إلى فئة معينة).

في هذه المشاكل ، يمكن للمرء تقديم مفهوم تشابه الكائنات وصياغة مجموعة من القواعد بناءً على أي كائن يتم تخصيصه لفئة واحدة أو فئات مختلفة.

من الممكن أيضًا العمل بمجموعة من الأمثلة ، التي يُعرف تصنيفها والتي ، في شكل أوصاف معينة ، يمكن الإعلان عنها لخوارزمية التعرف لتعديلها وفقًا للمهمة في عملية التعلم.

ترتبط الصعوبات في حل مشكلات التعرف بعدم القدرة على تطبيق الأساليب الرياضية الكلاسيكية دون تصحيحات (غالبًا لا توجد معلومات متاحة لنموذج رياضي دقيق)

هناك الأنواع التالية من مهام التعرف:

تتمثل مهمة التعرف في تخصيص الكائن المقدم وفقًا لوصفه إلى أحد الفصول الدراسية المعينة (التدريب مع المعلم) ؛

تتمثل مهمة التصنيف التلقائي في تقسيم المجموعة إلى نظام من الفئات غير المتداخلة (التصنيف ، التحليل العنقودي ، التعلم الذاتي) ؛

مشكلة اختيار مجموعة إعلامية من السمات في التعرف ؛

مهمة إحضار البيانات الأولية إلى شكل مناسب ؛

التعرف والتصنيف الديناميكي ؛

مهمة التنبؤ - أي أن القرار يجب أن يشير إلى لحظة معينة في المستقبل.

هناك مشكلتان أصعب في أنظمة التعرف الحالية:

مشكلة "1001 فئة" - إضافة فئة واحدة إلى 1000 فئة موجودة يسبب صعوبات في إعادة تدريب النظام والتحقق من البيانات التي تم الحصول عليها من قبل ؛

تتجلى مشكلة "ارتباط المفردات والمصادر" بقوة في التعرف على الكلام. يمكن للأنظمة الحالية التعرف على عدد كبير من الكلمات من مجموعة صغيرة من الأفراد ، أو كلمات قليلة من مجموعة كبيرة من الأفراد. من الصعب أيضًا التعرف على عدد كبير من الوجوه بالماكياج أو التجهم.

لا تحل الشبكات العصبية هذه المشكلات بشكل مباشر ، ومع ذلك ، نظرًا لطبيعتها ، فإنها تتكيف بسهولة أكبر مع التغييرات في تسلسل الإدخال.

4. مشاكل وآفاقتطويرالتعرف على الأنماط

4.1 تطبيق التعرف على الأنماط في الممارسة

بشكل عام ، تتكون مشكلة التعرف على الأنماط من جزأين: التعلم والتعرف. يتم التعلم من خلال إظهار كائنات مستقلة مع تعيينها لفئة أو أخرى. كنتيجة للتدريب ، يجب أن يكتسب نظام التعرف القدرة على الاستجابة بنفس ردود الفعل لجميع الكائنات في صورة واحدة والأشياء المختلفة لجميع الأشياء الأخرى. من المهم في عملية التعلم الإشارة فقط إلى الكائنات نفسها وانتمائها إلى الصورة. يتبع التدريب عملية التعرف التي تميز تصرفات نظام مدرب بالفعل. أتمتة هذه الإجراءات هي المشكلة.

قبل البدء في تحليل أي عنصر ، من الضروري الحصول على معلومات دقيقة ومرتبة بطريقة ما حوله. هذه المعلومات عبارة عن مجموعة من خصائص الأشياء ، يتم عرضها على مجموعة أجهزة الإدراك في نظام التعرف.

لكن يمكن لكل كائن مراقبة أن يتصرف بشكل مختلف ، اعتمادًا على ظروف الإدراك. بالإضافة إلى ذلك ، يمكن أن تكون كائنات نفس الصورة مختلفة تمامًا عن بعضها البعض.

عادةً ما يُطلق على كل تعيين لأي كائن للأعضاء المدركة لنظام التعرف ، بغض النظر عن موضعه بالنسبة لهذه الأعضاء ، صورة للكائن ، ومجموعات هذه الصور ، التي توحدها بعض الخصائص المشتركة ، هي صور. من خلال الاختيار الناجح للوصف الأولي (مساحة الميزة) ، يمكن أن تكون مهمة التعرف سهلة للغاية ، وعلى العكس من ذلك ، يمكن أن يؤدي الاختيار غير الناجح إلى مزيد من المعالجة الصعبة للغاية للمعلومات ، أو حتى إلى عدم وجود حل .

يعد التعرف على الأشياء والإشارات والمواقف والظواهر هو المهمة الأكثر شيوعًا التي يحتاجها الشخص لحلها كل ثانية. لهذا الغرض ، يتم استخدام موارد دماغية ضخمة ، والتي تقدر بمؤشر مثل عدد الخلايا العصبية ، يساوي 10 10.

أيضًا ، يتم التعرف باستمرار على التكنولوجيا. تذكرنا الحسابات في شبكات الخلايا العصبية الرسمية من نواح كثيرة بمعالجة الدماغ للمعلومات. في العقد الماضي ، أصبحت الحوسبة العصبية شائعة للغاية وتمكنت من التحول إلى تخصص هندسي مرتبط بإنتاج المنتجات التجارية. هناك قدر كبير من العمل جار لإنشاء قاعدة عنصر للحوسبة العصبية.

السمة المميزة لها هي القدرة على حل المشكلات غير الرسمية التي ، لسبب أو لآخر ، لا يُفترض وجود خوارزميات حل. تقدم الحواسيب العصبية تقنية بسيطة نسبيًا للحصول على الخوارزميات من خلال التدريب. هذه هي ميزتهم الرئيسية. لذلك ، تعد الحوسبة العصبية ذات صلة في الوقت الحالي - في ذروة الوسائط المتعددة ، عندما تتطلب التنمية العالمية تطوير تقنيات جديدة ترتبط ارتباطًا وثيقًا بالتعرف على الأنماط.

تظل إحدى المشكلات الرئيسية في تطوير وتطبيق الذكاء الاصطناعي مشكلة التعرف على الصور الصوتية والمرئية. جميع التقنيات الأخرى جاهزة بالفعل للعثور على تطبيقاتها في الطب وعلم الأحياء وأنظمة الأمان. في الطب ، يساعد التعرف على الأنماط الأطباء على إجراء تشخيصات أكثر دقة ؛ في المصانع ، يتم استخدامه للتنبؤ بالعيوب في دفعات من البضائع. تعتمد أنظمة التعرف على القياسات الحيوية ، باعتبارها جوهرها الحسابي ، أيضًا على نتائج التعرف. مزيد من التطوير والتصميم لأجهزة الكمبيوتر القادرة على التواصل المباشر مع شخص ما باللغات الطبيعية للناس ومن خلال الكلام غير قابل للحل دون التعرف عليه. هنا تبرز بالفعل مسألة تطوير الروبوتات ، وأنظمة التحكم الاصطناعية ، التي تحتوي على أنظمة التعرف كنظم فرعية حيوية.

خاتمة

كنتيجة للعمل ، تم تقديم لمحة موجزة عن التعريفات الرئيسية لمفاهيم مثل هذا القسم من علم التحكم الآلي مثل التعرف على الأنماط ، وتم تحديد طرق التعرف ، وصياغة المهام.

بالطبع ، هناك اتجاهات عديدة لتطوير هذا العلم. بالإضافة إلى ذلك ، وكما تمت صياغته في أحد الفصول ، يعد الاعتراف أحد المجالات الرئيسية للتنمية في الوقت الحالي. وبالتالي ، يمكن أن تصبح البرامج في العقود القادمة أكثر جاذبية للمستخدم وتنافسية في السوق الحديثة إذا اكتسبت تنسيقًا تجاريًا وبدأ توزيعها ضمن عدد كبير من المستهلكين.

يمكن توجيه مزيد من البحث إلى الجوانب التالية: التحليل المتعمق لطرق المعالجة الرئيسية وتطوير طرق جديدة مركبة أو معدلة للاعتراف. بناءً على البحث الذي تم إجراؤه ، سيكون من الممكن تطوير نظام التعرف الوظيفي ، والذي يمكن من خلاله اختبار طرق التعرف المختارة من أجل الفعالية.

فهرس

1. ديفيد فورمايس ، جان بونس كمبيوتر الرؤية. النهج الحديث ، 2004

2. Aizerman M.A.، Braverman E.M.، Rozonoer L.I. طريقة الوظائف المحتملة في نظرية التعلم الآلي. - م: نوكا ، 2004.

3. Zhuravlev Yu.I. في نهج جبري لحل مشاكل التعرف أو التصنيف // مشاكل علم التحكم الآلي. م: نوكا ، 2005. - إصدار. 33.

4. Mazurov V.D. لجان نظم عدم المساواة ومشكلة الاعتراف // علم التحكم الآلي ، 2004 ، رقم 2.

5. Potapov A.S. التعرف على الأنماط وإدراك الآلة. - سانت بطرسبرغ: البوليتكنيك ، 2007.

6. مينسكي م ، بابيرت س. Perceptrons. - م: مير ، 2007.

7. Rastrigin L. A.، Erenshtein R. Kh. طريقة الاعتراف الجماعي. إنرجوزدات ، 2006.

8. Rudakov K.V. في النظرية الجبرية للقيود العالمية والمحلية لمشاكل التصنيف // الاعتراف والتصنيف والتنبؤ. الطرق الرياضية وتطبيقاتها. مشكلة. 1. - م: نوكا ، 2007.

9. فو ك. الأساليب الإنشائية في التعرف على الأنماط. - م: مير ، 2005.

استضافت على Allbest.ru

...

وثائق مماثلة

    المفاهيم الأساسية لنظرية التعرف على الأنماط وأهميتها. جوهر النظرية الرياضية للتعرف على الأنماط. المهام الرئيسية الناشئة عن تطوير أنظمة التعرف على الأنماط. تصنيف أنظمة التعرف على الأنماط في الوقت الحقيقي.

    ورقة المصطلح ، تمت إضافة 01/15/2014

    مفهوم وميزات بناء خوارزميات التعرف على الأنماط. مناهج مختلفة لتصنيف طرق التعرف. دراسة الطرق الرئيسية لتمثيل المعرفة. توصيف الطرق المكثفة والامتدادية وتقييم جودتها.

    عرض تقديمي ، تمت إضافة 01/06/2014

    الأسس النظرية للتعرف على الأنماط. مخطط وظيفي لنظام التعرف. تطبيق طرق بايز في حل مشكلة التعرف على الأنماط. تجزئة الصورة بايزي. نموذج TAN لحل مشكلة تصنيف الصور.

    أطروحة تمت إضافة 10/13/2017

    مراجعة المهام الناشئة عن تطوير أنظمة التعرف على الأنماط. مصنفات الصور القابلة للتدريب. خوارزمية Perceptron وتعديلاتها. إنشاء برنامج مصمم لتصنيف الصور باستخدام أسلوب التربيعي الأقل متوسطًا للخطأ.

    ورقة مصطلح ، تمت إضافتها في 04/05/2015

    طرق التعرف على الأنماط (المصنفات): طريقة بايزي ، خطية ، للوظائف المحتملة. تطوير برنامج للتعرف على الشخص من خلال صوره. أمثلة على أعمال المصنفات ، نتائج تجريبية على دقة الأساليب.

    ورقة المصطلح ، تمت الإضافة في 08/15/2011

    إنشاء أداة برمجية تقوم بالتعرف على الصور المرئية بناءً على الشبكات العصبية الاصطناعية. الأساليب المستخدمة في التعرف على الأنماط. هرج ومرج سيلفريدج. بيرسبترون روزنبلات. قاعدة تشكيل رمز السلسلة.

    أطروحة تمت إضافة 04/06/2014

    التعرف على الأنماط هو مهمة تحديد كائن أو تحديد خصائصه من صورته أو تسجيله الصوتي. تاريخ التطورات النظرية والفنية في هذا المجال. الأساليب والمبادئ المستخدمة في الحوسبة للاعتراف.

    الملخص ، تمت الإضافة في 04/10/2010

    مفهوم نظام التعرف على الأنماط. تصنيف أنظمة التعرف. تطوير نظام للتعرف على شكل الأشياء الدقيقة. خوارزمية لإنشاء نظام للتعرف على الكائنات الدقيقة على مخطط بلوري ، وميزات تنفيذه في بيئة برمجية.

    ورقة مصطلح ، تمت إضافة 06/21/2014

    اختيار نوع وبنية الشبكة العصبية. اختيار طريقة التعرف ، رسم تخطيطي لشبكة هوبفيلد. تدريب نظام التعرف على الأنماط. مميزات العمل بالبرنامج ومزاياه وعيوبه. وصف واجهة المستخدم ونماذج الشاشة.

    ورقة مصطلح ، تمت الإضافة في 11/14/2013

    ظهور أنظمة تقنية التعرف الآلي. الإنسان كعنصر أو رابط للأنظمة الآلية المعقدة. إمكانيات أجهزة التعرف الآلي. مراحل إنشاء نظام التعرف على الصور. عمليات القياس والترميز.