هستان شناسی یا آنتولوژی چیست؟

هستان شناسی در واقع عبارت است از یک توصیف رسمی از دانش به عنوان مجموعه ای از مفاهیم در یک دامنه مشخص  و بیان ارتباطات بین این مفاهیم درون این دامنه.قبل از خواندن مقاله توجه داشته باشید سه مفهوم “هستان شناسی”، “هستی شناسی” و “آنتولوژی” در واقع اشاره به یک معنا و مفهوم دارند.

برای طراحی یک هستی شناسی لازم است اجزا آن نظیر اعضا( که به آن نمونه یا اشیا نیز می گوییم)، کلاس ها، خواص، ارتباطات، قیدها،قوانین و قواعد مشخص شوند. به طور کلی می توان گفت هستان شناسی نه فقط ساختار یک دانش را اشتراک گذاری کرده و قابل استفاده مجدد می کنند، بلکه همچنین می تواند دانش جدیدی را در رابطه با حوزه مورد نظر ارائه دهد .
البته روش های دیگری برای نمایش ساختار دانش مانند فرهنگ لغات ،دسته بندی ها، نقشه های موضوعی و مدلهای منطقی وجود دارد. هر چند بر خلاف دسته بندی های سنتی یا پایگاه داده های رابطه ای،  هستان شناسی ها به ما اجازه می دهد ارتباطات را به اشکال مختلف و پیچیده ترین حالت ممکن بین مفاهیم و اجزا و عناصر تعیین کنیم .به عنوان یکی از از واحدهای سازنده تکنولوژی های معنایی، هستان شناسی ها بخشی از استاندارد W3C وب معنایی می باشد. هستان شناسی ها ساختار اساسی و زیربنایی برای برقراری ارتباط بین اجزاء مختلف اطلاعات در فضای وب را به منظور فراهم کردن داده های پیوندی ایجاد می کند. به دلیل آنکه از هستی شناسی برای ایجاد یک ساختار مدل شده مشترک از داده برای پایگاه داده ها و سیستم های عامل توزیع شده و ناهمگن استفاده می شود، هستان شناسی ها قابلیت تعامل بین پایگاه های داده، جستجوی بین پایگاه های داده و مدیریت منسجم داده را فراهم می کند .

هستان شناسی ها راهکاری برای مدیریت بهتر داده ها

برخی از مهم‌ترین ویژگی‌های هستان شناسی ها این است که می تواند یک درک مشترک از اطلاعات را فراهم کند و پیش فرض های مشخصی را در رابطه با حوزه هدف ارائه دهند. درنتیجه، قابلیت همکاری متقابل و برقراری ارتباطات متعدد بین عناصر یک مدل هستان شناسی، آن را به عنوان یک راهکار بسیار ارزشمند برای حل مشکلات مربوط به دسترسی و بازیابی داده ها در سازمان ها و ساختارهای بزرگ مطرح کرده است.همچنین هستان شناسی ها با توسعه و بهبود دادن کاربرد فراداده ها (metadata) که در نتیجه به سازمان ها این امکان را می دهد که معنای بهتر و دقیق تری از داده‌های خود ارائه دهند،کیفیت داده ها را افزایش داده است.

 

استاندارد owl و مدل سازی هستان شناسی

 

در سال های اخیر حرکتی به سوی استفاده از زبان‌های هستان شناسی نظیر OWL ایجاد شده است. OWL یک زبان محاسباتی مبتنی بر منطق برای وب معنایی می باشد، که برای نمایش دانش پیچیده در رابطه با اشیا و ارتباطات بین آنها طراحی شده است. این زبان هم چنین تفاوتهای موجود بین کلاس ها، ویژگی ها و ارتباطات را به نحو بسیار دقیق و معناداری ایجاد می کند.با مشخص کردن کلاس ها و مشخصه های ارتباطات بین آنها و همچنین ساختار سلسله مراتبی آن ها ، OWL مدل سازی هستان شناسی را در پایگاه داده های معنایی (که تحت عنوان سه گانه هایRDF شناخته می شوند) فراهم می کند.OWL به همراه یک یک موتور استنتاج OWL مورد استفاده قرار می گیرد تا پایداری و سازگاری ساختارهای RDF را بررسی کنند .همچنین OWL مجهز به قابلیتی است که می تواند برای کلاس ها، اعضا و ویژگی ها قابلیت معادل بودن و متفاوت بودن نسبت به سایر کلاس اعضا و ویژگی ها را معین کند.ارتباطات به کاربران کمک می کند به نحو موثرتری بتوانند مفاهیم یکسان را پیدا کند حتی اگر منابع داده مختلف، آن مفاهیم را تا حدودی متفاوت بیان کرده باشد .همچنین باعث رفع ابهام بین اعضایی می شود که توصیفات یا اسامی یکسان دارند .

مزایای استفاده از هستی شناسی

یکی از ویژگی های اصلی هستان شناسی ها این است که با داشتن روابط اصلی بین مفاهیم می توان استنتاج خودکار درباره داده ها ایجاد کرد. پیاده سازی کردن چنین استنتاج هایی در پایگاه داده های گراف معنایی که از هستان شناسی به عنوان شماتیک معنایی خود استفاده می کنند به سهولت صورت می گیرد.علاوه بر این هستان شناسی ها مشابه یک مغز عمل می کنند.هستان شناسی ها درکی مشابه درک یک انسان از مفاهیم و ارتباطات را دارند و می توانند همانند مغز انسان استنتاج کنند.
علاوه بر ویژگی استنتاج، انتولوژی ها ،به کاربر اجازه می دهد به نحوی منسجم و ساده بتواند از یک مفهوم به مفهوم دیگری درون هستی شناسی مسیریابی کند.ویژگی ارزشمند دیگر این است که هستان شناسی ها به سادگی قابل توسعه هستند. در نتیجه هستی شناسی ها با افزایش داده ها غنی تر می شوند و رشد بهتری پیدا می کند بدون آنکه در صورت وجود خطا یا نیاز به تغییر در هستان شناسی اثر نامطلوبی بر روی فرایند یا سیستم استفاده کننده بگذارد.همچنین هستان شناسی ها بستر مناسبی را برای نمایش دادن هر نوع فرمت داده فراهم می کند نظیر داده های ساخت یافته و نیمه ساخت یافته یا کاملا ساخت یافته .همچنین امکان یکپارچه سازی و جمع آوری بهتر داده ها، امکان متن کاوی آسان تر و تحلیل های مبتنی بر داده را فراهم می کند .

محدودیت های هستی شناسی

 

در حالی که هستان شناسی ها یک مجموعه از ابزارها برای مدل سازی داده ها فراهم می کنند، اما از سوی دیگر با محدودیت های نیز روبرو هستند.یکی از این محدودیت ها وضعیت ساختار ویژگی ها می باشد .برای مثال هنگامی که ساختار کلاس های پیچیده را طراحی می کنیم جدیدترین نسخه هستان شناسی یعنی OWL با برخی محدودیت ها در رابطه با ساختارهای ویژگی ها روبرو است. محدودیت بعدی در رابطه با نحوه کاربرد قیدها توسط OWL می باشد. از این قید ها استفاده می‌کنیم تا تعیین کنیم که داده ها چگونه باید ساختار پیدا کنند و از اضافه شدن داده های ناسازگار توسط این قیدها پیشگیری می شود. اما این موضوع همیشه سودمند نیست. غالبا داده های وارد شده از یک منبع داده جدید به ساختار های سه گانه RDF به طور ساختاری با قیدهای تعیین شده توسط OWL ناسازگار خواهند بود. در نتیجه داده های جدید باید قبل از این که با داده های موجود در پایگاه داده RDF ترکیب شوند اصلاح گردد. یک راهکار جایگزین جدید برای استفاده از هستی شناسی ها به منظور مدل سازی داده ها، استفاده از زبان مقید SHApes یا همان SHACL برای ارزیابی گرافهای RDF در برابر مجموعه‌ای از قیدها می باشد .یک قالب SHApes  در واقع فراداده هایی را در رابطه با نوع یک منبع ایجاد می کند که اطلاعاتی شامل:

  • چگونه قبلا این منبع مورد استفاده قرار می گرفته؟
  • چگونه می تواند مورد استفاده قرار گیرد؟
  • چگونه الزاماً باید مورد استفاده قرار گیرد؟

به این نحو، SHACL مشابه با OWL می تواند به منظور ارزیابی داده ها اعمال گردد.هرچند SHACL برخلاف OWL می‌تواند به داده هایی که قبلا درون پایگاه داده RDF موجود هستند اعمال گردد. به بیانی دیگر SHACL به داده های ناسازگار اجازه بارگذاری در پایگاه داده را می دهد.

نمونه مورد استفاده از آنتولوژی ها

از آنجایی که هستی شناسی ها اصطلاحاتی را که برای توصیف نمایش حوزه ای از دانش مورد استفاده قرار می گیرند را تعریف می کند، در برنامه ها و کاربردهای متعددی برای ثبت ارتباطات و سرعت بخشیدن به مدیریت دانش مورد استفاده قرار می گیرد.
تطبیق هستان شناسی ها در حوزه پزشکی به منظور پیدا کردن علت بیماری ها با دسته بندی ارتباطات این علائم و بیماری های مختلف صورت می گیرد همچنین از هستان شناسی ها برای وب کاوی معنایی، پردازش اطلاعات بیماران، تشخیص کلاهبرداری و  غیره استفاده می شود. به طور خلاصه از هستی شناسی ها برای بیان ساختارهایی برای نمایش دانش در یک حوزه معین به صورتی که قابلیت استفاده مجدد و اشتراک گذاری داشته باشد استفاده می شود. قابلیت آنها برای بیان ارتباطات و توانمندی بسیار بالای آن ها در بیان ارتباطات تودرتو، آنها را به عنوان یک زیربنا برای مدل سازی با کیفیت، پیوندی و منسجم داده ها مطرح می کند.

در صورتی که مایل باشید می توانید پیاده سازی پروژه طراحی آنتولوژی خود را به ما بسپارید. برای اطلاعات بیشتر کلیک کنید
Open chat