پردازش زبان طبیعی NLP توسط آنتولوژی

وظیفه آنتولوژی فراهم آوردن محتوای معنایی می باشد
شناسایی موجودیت ها در متن ساخت نیافته تمام کاری که باید انجام دهیم نیست .مدل‌های آنتولوژی با نمایش این که چگونه موجودیت ها به سایر موجودیت ها (چه در همان متن و چه در یک حوزه کلی ) مرتبط می شوند ساختار را تکمیل می کنند.

همانطور که در تصویر بالا مشاهده می کنید این عبارت علامت گذاری شده است و کمان هایی به رنگ قرمز در تصویر مشخص می باشد. ما فقط دو کلمه را در این متن علامت گذاری کرده ایم. ویلیام شکسپیر به عنوان یک نمایشنامه نویس و هملت به عنوان یک نمایش نامه.اما به عمق دانشی که در این متن داریم توجه کنید.در این تصویر ما یک مدل را رسم کرده ایم .طبق تصویر مشخص است که ۶ عدد علامت گذاری توسط کمان ها صورت گرفته است .این علامت گذاری ها توسط موتور NLP صورت گرفته است و مدل سازی شده است.این مدل سازی درون یک آنتولوژی انجام شده است. در واقع ما توسط هستان شناسی می‌فهمیم که چگونه یک کتاب(Book) با یک تاریخ (Date) یا یک زبان (Language) و همچنین یک زبان با یک کشور(Country)  و آن هم با یک نویسنده(Author) و غیره مرتبط است .هر کدام از علامت گذاری ها توسط یک دیکشنری پشتیبانی می شود داده های این دیکشنری در خارج از حیطه آنتولوژی مربوطه ساخته شده است.آنتولوژی فقط ارتباطات بین علامت گذاری ها با یکدیگر را نمایش می دهد .علامت گذاری ویلیام شکسپیر به عنوان یک نویسنده یک ساختار سه تایی ضمنی محسوب می شود :
ویلیام شکسپیر یک نویسنده است

گذار به داده های ساخت یافته (استخراج سه تایی ها)

هم اکنون ما در ابتدای مرحله انتقال از حالت ساخت نیافته به قلمرو داده‌های ساخت‌یافته می باشیم اگر بدانیم که ویلیام شکسپیر یک نویسنده است همچنین می دانیم که هر نویسنده در کشوری زندگی می کند و همچنین نویسنده ها کتاب هایی را می نویسند که در تاریخ های مشخصی منتشر می شود و به زبان مشخصی هم نوشته شده است و غیره.
یک زنجیره معنایی کامل از اطلاعات داریم که می‌توانند از این عبارت استخراج شود و نکته اصلی همین جاست .علاوه بر این هستی شناسی به ما کمک می‌کند تا بفهمیم چه داده هایی را نداریم .اگر موتور NLP بتواند نویسنده و عنوان را تشخیص دهد چه چیزی را تشخیص نداده است؟

به نظر می رسد که همه کتاب ها در در یک تاریخ معینی انتشار می یابند بنابراین به دنبال این تاریخ بگردیم همچنین به نظر می رسد که در موضوع نوشتن کتاب یک زبان هم مطرح است بنابراین می‌توانیم آن را هم بیابیم .به طور خلاصه آنتولوژی ارتباطاتی را که بین موجودیت ها یا علامت گذاری ها وجود دارد را به ما میدهد .آنتولوژی به ما کمک می‌کند که هر علامت گذاری را در یک حوزه وسیع تر ( حوزه زنجیره معنایی و شبکه معنایی) داشته باشیم. همچنین کمک می کند تا بدانیم چه اطلاعاتی را نداریم و باید دنبال کدام اطلاعات در متن بگردیم .

در صورتی که مایل باشید می توانید پیاده سازی پروژه طراحی آنتولوژی خود را به ما بسپارید. برای اطلاعات بیشتر کلیک کنید
Open chat