<?xml version="1.0" encoding="UTF-16"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1 plus MathML 2.0//EN"
  "http://www.w3.org/Math/DTD/mathml2/xhtml-math11-f.dtd">
<html
  xmlns="http://www.w3.org/1999/xhtml">
<head profile="http://dublincore.org/documents/dcmi-terms/">
  <meta http-equiv="Content-Type" content="application/xhtml+xml; charset=utf-8"/>
  <title xml:lang="ru-RU">АВТОМАТИЧЕСКОЕ ПОСТРОЕНИЕ ОНТОЛОГИЙ | СЕУСЛАБ</title>
  <meta name="DCTERMS.title" content="" xml:lang="ru-RU"/>
  <meta name="DCTERMS.language" content="ru-RU" scheme="DCTERMS.RFC4646"/>
  <meta name="DCTERMS.issued" content="2022-07-25T12:36:28" scheme="DCTERMS.W3CDTF"/>
  <meta name="DCTERMS.modified" content="2022-07-25T20:26:29.210000000" scheme="DCTERMS.W3CDTF"/>
  <meta name="DCTERMS.provenance" content="" xml:lang="ru-RU"/>
  <meta name="DCTERMS.subject" content="," xml:lang="ru-RU"/>
  <link rel="schema.DC" href="http://purl.org/dc/elements/1.1/" hreflang="en"/>
  <link rel="schema.DCTERMS" href="http://purl.org/dc/terms/" hreflang="en"/>
  <link rel="schema.DCTYPE" href="http://purl.org/dc/dcmitype/" hreflang="en"/>
  <link rel="schema.DCAM" href="http://purl.org/dc/dcam/" hreflang="en"/>
  <style type="text/css">
    @page {
    }

    table {
      border-collapse: collapse;
      border-spacing: 0;
      empty-cells: show
    }

    td, th {
      vertical-align: top;
      font-size: 12pt;
    }

    h1, h2, h3, h4, h5, h6 {
      clear: both;
    }

    ol, ul {
      margin: 0;
      padding: 0;
    }

    li {
      list-style: none;
      margin: 0;
      padding: 0;
    }

    /* "li span.odfLiEnd" - IE 7 issue*/
    li span. {
      clear: both;
      line-height: 0;
      width: 0;
      height: 0;
      margin: 0;
      padding: 0;
    }

    span.footnodeNumber {
      padding-right: 1em;
    }

    span.annotation_style_by_filter {
      font-size: 95%;
      font-family: Arial;
      background-color: #fff000;
      margin: 0;
      border: 0;
      padding: 0;
    }

    span.heading_numbering {
      margin-right: 0.8rem;
    }

    * {
      margin: 0;
    }

    .P1 {
      font-size: 11pt;
      line-height: 0.423cm;
      margin-bottom: 0.282cm;
      margin-top: 0cm;
      text-align: center ! important;
      font-family: Calibri;
      writing-mode: lr-tb;
    }

    .P10 {
      font-size: 14pt;
      line-height: 115%;
      margin-bottom: 0.282cm;
      margin-top: 0cm;
      text-align: justify ! important;
      font-family: Times New Roman;
      writing-mode: lr-tb;
      color: #000000;
      font-style: normal;
      font-weight: normal;
    }

    .P11 {
      font-size: 11pt;
      line-height: 0.568cm;
      margin-bottom: 0.282cm;
      margin-top: 0cm;
      text-align: justify ! important;
      font-family: Calibri;
      writing-mode: lr-tb;
    }

    .P12 {
      font-size: 11pt;
      line-height: 0.568cm;
      margin-bottom: 0.282cm;
      margin-top: 0cm;
      text-align: center ! important;
      font-family: Calibri;
      writing-mode: lr-tb;
    }

    .P13 {
      font-size: 11pt;
      line-height: 115%;
      margin-bottom: 0.282cm;
      margin-top: 0cm;
      text-align: left ! important;
      font-family: Calibri;
      writing-mode: lr-tb;
    }

    .P14 {
      font-size: 11pt;
      line-height: 0.446cm;
      margin-bottom: 0cm;
      margin-top: 0cm;
      text-align: justify ! important;
      font-family: Calibri;
      writing-mode: lr-tb;
    }

    .P15 {
      font-size: 14pt;
      line-height: 115%;
      margin-bottom: 0.282cm;
      margin-top: 0cm;
      text-align: justify ! important;
      font-family: Calibri;
      writing-mode: lr-tb;
      margin-left: 1.381cm;
      margin-right: 0cm;
      text-indent: 0cm;
      color: #000000;
      font-style: normal;
      font-weight: normal;
    }

    .P16 {
      font-size: 11pt;
      line-height: 0.423cm;
      margin-bottom: 0.282cm;
      margin-top: 0cm;
      text-align: right ! important;
      font-family: Calibri;
      writing-mode: lr-tb;
    }

    .P17 {
      font-size: 11pt;
      line-height: 115%;
      margin-bottom: 0.282cm;
      margin-left: 1.27cm;
      margin-right: 0cm;
      margin-top: 0cm;
      text-align: justify ! important;
      text-indent: 0cm;
      font-family: Calibri;
      writing-mode: lr-tb;
    }

    .P18 {
      font-size: 11pt;
      line-height: 115%;
      margin-bottom: 0.282cm;
      margin-left: 1.27cm;
      margin-right: 0cm;
      margin-top: 0cm;
      text-align: justify ! important;
      text-indent: 0cm;
      font-family: Calibri;
      writing-mode: lr-tb;
    }

    .P19 {
      font-size: 11pt;
      line-height: 115%;
      margin-bottom: 0.282cm;
      margin-left: 1.27cm;
      margin-right: 0cm;
      margin-top: 0cm;
      text-align: justify ! important;
      text-indent: 0cm;
      font-family: Calibri;
      writing-mode: lr-tb;
    }

    .P2 {
      font-size: 11pt;
      line-height: 0.423cm;
      margin-bottom: 0.282cm;
      margin-top: 0cm;
      text-align: justify ! important;
      font-family: Calibri;
      writing-mode: lr-tb;
    }

    .P20 {
      font-size: 11pt;
      line-height: 115%;
      margin-bottom: 0.282cm;
      margin-left: 1.27cm;
      margin-right: 0cm;
      margin-top: 0cm;
      text-align: left ! important;
      text-indent: 0cm;
      font-family: Calibri;
      writing-mode: lr-tb;
    }

    .P3 {
      font-size: 11pt;
      line-height: 0.446cm;
      margin-bottom: 0.282cm;
      margin-top: 0cm;
      text-align: justify ! important;
      font-family: Calibri;
      writing-mode: lr-tb;
    }

    .P4 {
      font-size: 11pt;
      line-height: 0.446cm;
      margin-bottom: 0.282cm;
      margin-top: 0cm;
      text-align: left ! important;
      font-family: Calibri;
      writing-mode: lr-tb;
    }

    .P5 {
      font-size: 11pt;
      line-height: 0.446cm;
      margin-bottom: 0.282cm;
      margin-top: 0cm;
      text-align: center ! important;
      font-family: Calibri;
      writing-mode: lr-tb;
    }

    .P6 {
      font-size: 11pt;
      line-height: 115%;
      margin-bottom: 0.282cm;
      margin-top: 0cm;
      text-align: left ! important;
      font-family: Calibri;
      writing-mode: lr-tb;
    }

    .P7 {
      font-size: 11pt;
      line-height: 115%;
      margin-bottom: 0.282cm;
      margin-top: 0cm;
      text-align: justify ! important;
      font-family: Calibri;
      writing-mode: lr-tb;
    }

    .P8 {
      font-size: 14pt;
      line-height: 0.446cm;
      margin-bottom: 0.282cm;
      margin-top: 0cm;
      text-align: justify ! important;
      font-family: Times New Roman;
      writing-mode: lr-tb;
      color: #000000;
      font-style: normal;
      text-decoration: none ! important;
      font-weight: normal;
    }

    .P9 {
      font-size: 11pt;
      line-height: 115%;
      margin-bottom: 0.282cm;
      margin-top: 0cm;
      text-align: center ! important;
      font-family: Calibri;
      writing-mode: lr-tb;
      color: #000000;
      font-style: normal;
      font-weight: normal;
    }

    .Таблица1 {
      width: 10.292cm;
      margin-left: 3.651cm;
      margin-top: 0cm;
      margin-bottom: 0cm;
      margin-right: auto;
      writing-mode: lr-tb;
    }

    .Таблица1_A1 {
      background-color: transparent;
      padding-left: 0.191cm;
      padding-right: 0.191cm;
      padding-top: 0cm;
      padding-bottom: 0cm;
      border-left-width: 0.0265cm;
      border-left-style: solid;
      border-left-color: #000000;
      border-right-style: none;
      border-top-width: 0.0265cm;
      border-top-style: solid;
      border-top-color: #000000;
      border-bottom-width: 0.0265cm;
      border-bottom-style: solid;
      border-bottom-color: #000000;
    }

    .Таблица1_B1 {
      background-color: transparent;
      padding-left: 0.191cm;
      padding-right: 0.191cm;
      padding-top: 0cm;
      padding-bottom: 0cm;
      border-width: 0.0265cm;
      border-style: solid;
      border-color: #000000;
    }

    .Таблица1_A {
      width: 4.84cm;
    }

    .Таблица1_B {
      width: 5.45cm;
    }

    .Internet_20_link {
      color: #0563c1;
      text-decoration: underline;
    }

    .ListLabel_20_14 {
      font-family: Calibri;
      font-size: 11pt;
      font-weight: normal;
    }

    .ListLabel_20_32 {
      color: #000000;
      font-size: 14pt;
      font-style: normal;
      font-weight: normal;
    }

    .ListLabel_20_33 {
      color: #000000;
      font-size: 14pt;
      font-style: normal;
      font-weight: normal;
    }

    .ListLabel_20_34 {
      color: #000000;
      font-family: Times New Roman;
      font-size: 14pt;
      font-style: normal;
      font-weight: normal;
    }

    .ListLabel_20_35 {
      color: #000000;
      font-family: Times New Roman;
      font-size: 14pt;
      font-style: normal;
      font-weight: normal;
    }

    .ListLabel_20_5 {
      font-family: Calibri;
      font-size: 11pt;
      font-weight: normal;
    }

    .T1 {
      color: #000000;
      font-family: Times New Roman;
      font-size: 14pt;
      font-style: italic;
      font-weight: bold;
    }

    .T12 {
      color: #000000;
      font-family: Times New Roman;
      font-size: 14pt;
      font-style: normal;
      text-decoration: none ! important;
      font-weight: normal;
    }

    .T13 {
      color: #000000;
      font-family: Times New Roman;
      font-size: 14pt;
      font-style: normal;
      text-decoration: none ! important;
      font-weight: bold;
    }

    .T14 {
      color: #000000;
      font-family: Times New Roman;
      font-size: 14pt;
      font-style: normal;
      font-weight: normal;
    }

    .T15 {
      color: #000000;
      font-size: 14pt;
      font-style: normal;
      text-decoration: none ! important;
      font-weight: normal;
    }

    .T16 {
      color: #000000;
      font-size: 14pt;
      font-style: normal;
      font-weight: normal;
    }

    .T18 {
      color: #000000;
      font-size: 14pt;
      font-style: normal;
      font-weight: normal;
    }

    .T2 {
      color: #000000;
      font-family: Times New Roman;
      font-size: 14pt;
      font-style: normal;
      font-weight: normal;
    }

    .T3 {
      color: #000000;
      font-family: Times New Roman;
      font-size: 14pt;
      font-style: normal;
      font-weight: bold;
    }

    .T4 {
      color: #000000;
      font-family: Times New Roman;
      font-size: 14pt;
      font-style: normal;
      font-weight: normal;
    }

    .T5 {
      color: #000000;
      font-family: Times New Roman;
      font-size: 16pt;
      font-style: normal;
      font-weight: bold;
    }

    .T6 {
      color: #000000;
      font-family: Times New Roman;
      font-size: 15.5pt;
      font-style: normal;
      font-weight: bold;
    }

    .T7 {
      color: #000000;
      font-family: Times New Roman;
      font-size: 12pt;
      font-style: normal;
      font-weight: normal;
    }

    .T8 {
      color: #000000;
      font-size: 11pt;
      font-style: normal;
      font-weight: normal;
    }

    /* ODF styles with no properties representable as CSS */
    .Таблица1

    .1
    .ListLabel_20_10 .ListLabel_20_11 .ListLabel_20_12 .ListLabel_20_13 .ListLabel_20_15 .ListLabel_20_16 .ListLabel_20_17 .ListLabel_20_18 .ListLabel_20_19 .ListLabel_20_20 .ListLabel_20_21 .ListLabel_20_22 .ListLabel_20_23 .ListLabel_20_24 .ListLabel_20_25 .ListLabel_20_26 .ListLabel_20_27 .ListLabel_20_28 .ListLabel_20_29 .ListLabel_20_30 .ListLabel_20_31 .ListLabel_20_6 .ListLabel_20_7 .ListLabel_20_8 .ListLabel_20_9 {
    }
  </style>
  <script type="text/javascript" src="./yandex-counter.js"></script>
</head>
<body dir="ltr"
      style="max-width:21.001cm;margin-top:2.54cm; margin-bottom:2.54cm; margin-left:2.54cm; margin-right:2.54cm; "><p
  class="P16"><span class="T1">Е.А. Рабчевский</span></p>
<p class="P1"><span class="T5">АВТОМАТИЧЕСКОЕ ПОСТРОЕНИЕ ОНТОЛОГИЙ</span></p>
<p class="P2"><span class="T2"> </span></p>
<p class="P3"><span class="T2">Каждый Интернет-пользователь периодически посещает сайты профессиональных сообществ, осуществляет подписку, просматривает тематические рассылки и RSS-подачи, ищет в поисковых системах неизвестные термины и.т.п. У каждого пользователя, таким образом, выстроена своя использующая различные Интернет-технологии система интеграции знаний в интересующей его предметной области. Однако задачи пользователей требуют более систематизированного и настраиваемого механизма интеграции распределенных и разнородных знаний в целостную картину предметной области. Заметим, что оригинальная спецификация WWW [1] была разработана именно для решения задачи интеграции научных материалов.</span>
</p>
<p class="P3"><span class="T2"> Очевидно, что для эффективной интеграции данных некой предметной области из различных Интернет-источников соответствующее приложение должно работать с семантикой веб-ресурсов. В таких приложениях актуально использование различных технологий Semantic Web [2].</span>
</p>
<p class="P4"><span class="T8"> </span></p>
<p class="P3"><span class="T3">Стандарты Semantic Web</span></p>
<p class="P6"><span class="T8"> </span></p>
<p class="P7"><span class="T2">В Интернет используется множество языков представления данных, основанных на XML. В рамках проекта Semantic Web, для представления данных, имеющих графовую структуру, консорциум W3 разработал язык RDF (Resource Definition Framework – Среда Описания Ресурса). RDF предоставляет средства для записи триплетов, троек данных – субъект - предикат - объект. Объект и субъект соответствуют узлам графа, а предикат или свойство - направленной дуге графа. Дуга направлена от субъекта к объекту. Каждый из элементов триплета называют RDF ресурсом и идентифицируют с помощью URI идентификаторов.</span>
</p>
<p class="P7"><span class="T8"> </span></p>
<p class="P7"><span class="T2">    Платформа RDF активно используется для представления различных данных, в частности RSS 3.0 агрегаторы новостей собирают информацию в формате RDF.</span>
</p>
<p class="P7"><span class="T8"> </span></p>
<p class="P7"><span class="T2">    Для машинного представления различных предметных областей в Интернет, используются онтологии и словари. Онтология – спецификация концептуализации [3], или явное, формальное описание предметной области. Как и в объектноориентированном описании, онтология состоит </span><span
  class="T2">из классов и их экземпляров. У классов и экземпляров выделяются свойства, на свойства могут накладываться логические ограничения.</span>
</p>
<p class="P7"><span class="T2"> </span></p>
<p class="P7"><span class="T2">    Поисковой системой SWOOGLE [4] на сегодня проиндексировано свыше 10 тысяч онтологий и словарей, доступных в Веб. Онтологии используются научными сообществами – для описания терминологии [5], в электронной коммерции – для описания товаров и услуг [6], и в других приложениях Интернет. Из-за своей популярности онтологии стали использоваться и в качестве баз знаний локальных интеллектуальных систем.</span>
</p>
<p class="P7"><span class="T8"> </span></p>
<p class="P7"><span class="T2">     Для описания онтологий, доступных через Веб, созданы языки RDFS [7] (RDF Schema – RDF Схема) и OWL [8] (Ontology Web Language - Язык Сетевых Онтологий). В качестве своих базовых элементов данные языки используют RDF ресурсы. RDFS используется для записи словарей, а OWL – онтологий. Сетевые онтологии предоставляют более выразительные возможности по сравнению с RDF словарями, например логические операции над классами и логические ограничения свойств.</span>
</p>
<p class="P7"><span class="T3">Постановка задачи.</span><span class="T2"> Интеллектуальные системы на основе онтологий показали на практике свою эффективность, однако построение онтологии требует экспертных знаний в исследуемой предметной области и занимает существенный объем времени, поэтому актуальной задачей является автоматизация процесса построения онтологии. Для этого предлагается использовать текстовое содержание массива Веб ресурсов описательного характера определенной тематики.</span>
</p>
<p class="P7"><span class="T2">  Базовой является задача разработки алгоритма автоматического построения семантической карты веб ресурса с помощью анализа его текста. Семантической картой ресурса назовем отображение контента Веб ресурса в концептуализацию его содержания, представленную в виде OWL онтологии.</span>
</p>
<p class="P7"><span class="T2">    Для решения данной задачи был сформирован корпус англоязычных текстов, относящихся к теме Semantic Web. Ресурсы корпуса представляют собой спецификации технологий Semantic Web с сайта W3 консорциума.</span>
</p>
<p class="P7"><span class="T2">  Алгоритм исследовался для определенной предметной области, что объясняется профессиональными интересами автора, а также возможностью последующей оценки полученного метода сравнением результатов с онтологией, полученной с помощью экспертных знаний (параллельно с данными исследованиями автор анализировал выбранный корпус и создавал онтологию данной предметной области без средств автоматизации).</span>
</p>
<p class="P7"><span class="T2"> </span></p>
<p class="P7"><span class="T6">Построение семантической карты ресурса.</span><span class="T2"> Такая карта строится на основе особенностей языка, которые позволяют вытягивать семантические конструкции из текста.</span>
</p>
<ul>
  <li><p class="P17" style="margin-left:1.27cm;"><span class="ListLabel_20_5"
                                                       style="display:block;float:left;min-width:0.635cm;">•</span><span
    class="T2">Исследования проводились следующим образом:</span><span class="T8"> </span><span class="odfLiEnd"/> </p>
  </li>
  <li><p class="P17" style="margin-left:1.27cm;"><span class="ListLabel_20_5"
                                                       style="display:block;float:left;min-width:0.635cm;">•</span><span
    class="T2">Формировался набор пар “текст -- конструкция языка OWL”;</span><span class="T8"> </span><span
    class="odfLiEnd"/> </p></li>
</ul>
<p class="P7"><span class="T2">  По набору выявленных пар “текст -- OWL-конструкция” выявлялись правила, позволяющие автоматизировать процесс отображения текста в соответствующую OWL-конструкцию.</span>
</p>
<p class="P7"><span class="T2">    Семантическая карта строится в два этапа, сначала строится формальная семантическая OWL-конструкция, затем происходит привязка полученной конструкции к конкретной предметной области.</span>
</p>
<p class="P7"><span class="T2"> </span></p>
<p class="P7"><span class="T2">  Сформулируем правила, использующие синтаксис языка. Правила синтаксического уровня, выявляют семантику на основе принципов построения словосочетаний и предложений. Правила формулируются, как конструкции из различных частей речи, частей предложения, предлогов и союзов, а также конкретных слов. Дополнительно вводится понятие предмета – сущности, о которой говорится в предложении, предмет может состоять из нескольких слов. Понятие предмета также используется для формулировки правил.</span>
</p>
<p class="P7"><span class="T2"> Рассмотрим несколько правил:</span></p>
<ul>
  <li><p class="P18" style="margin-left:1.27cm;"><span class="ListLabel_20_23"
                                                       style="display:block;float:left;min-width:0.635cm;">•</span><span
    class="T2">«Сложный предмет» или «noun1 + noun2» (два подряд идущих существительных), например словосочетание «ontology editor» (редактор онтологии).</span><span
    class="T8"> </span><span class="odfLiEnd"/> </p></li>
</ul>
<p class="P7"><span class="T2">  Проанализируем данный пример. Можно предположить существует целый класс абстрактных редакторов – Editor. Этот класс характеризуется тем, что все его экземпляры обладают неким характерным для этого класса свойством, в данном случае - они все что-либо редактируют.</span>
</p>
<p class="P7"><span class="T2">  Назовем это характерное свойство mainPropertyOfEditor (главное свойство редактора). Доменом этого свойства является класс Editor. Определим диапазон этого свойства, как класс RangeOfMainPropertyOfEditor (диапазон главного свойства редактора). Выделим класс OntologyEditor, который будет подклассом класса Editor. При этом значение свойства main Property Of Editor для подкласса Ontology Editor имеет строго определенное значение – экземпляр класса RangeOfMainPropertyOfEditor, индивид Ontology. Данные утверждения можно представить следующим OWL кодом:</span>
</p>
<p class="P7"><span class="T12"> </span></p>
<p class="P3"><span class="T15">&lt;owl:Class   rdf:ID="Editor"&gt;</span></p>
<p class="P3"><span class="T15">   &lt;rdfs:comment</span></p>
<p class="P3"><span class="T15">rdf:datatype=</span><span class="T2"> »</span><a href="http://www.w3.org/2001/"
                                                                                 class="ListLabel_20_32"><span
  class="Internet_20_link"><span class="T16">http://www.w3.org/2001/</span></span></a><span
  class="T15">XMLSchema#string</span><span class="T2">»</span></p>
<p class="P3"><span class="T15">    &gt;класс абстрактных редакторов&lt;/rdfs:comment&gt;</span></p>
<p class="P3"><span class="T15">  &lt;/owl:Class&gt;</span></p>
<p class="P3"><span class="T15">   &lt;owl:Class rdf:ID=vRangeOfMainPropertyOfEditor</span><span
  class="T2">»</span><span class="T15">&gt;</span></p>
<p class="P3"><span class="T15">     &lt;rdfs:comment</span></p>
<p class="P3"><span class="T15">rdf:datatype=</span><span class="T2"> »</span><a href="http://www.w3.org/2001/"
                                                                                 class="ListLabel_20_32"><span
  class="Internet_20_link"><span class="T16">http://www.w3.org/2001/</span></span></a><span
  class="T15">XMLSchema#string</span><span class="T2">»</span></p>
<p class="P3"><span class="T15">      &gt;диапазон характерного свойства редактора (редактируемый</span></p>
<p class="P3"><span class="T15">объект)&lt;/rdfs:comment&gt;</span></p>
<p class="P3"><span class="T15">    &lt;/owl:Class&gt;</span></p>
<p class="P3"><span class="T15">     &lt;owl:Class  rdf:ID=</span><span class="T2"> »</span><span class="T15">OntologyEditor</span><span
  class="T2">»</span><span class="T15">&gt;</span></p>
<p class="P3"><span class="T15">       &lt;rdfs:subClassOf&gt;</span></p>
<p class="P3"><span class="T15">        &lt;owl:Restriction&gt;</span></p>
<p class="P3"><span class="T15">         &lt;owl:onProperty&gt;</span></p>
<p class="P3"><span class="T15">             &lt;owl:ObjectProperty  rdf:ID=</span><span class="T2"> »</span><span
  class="T15">MainPropertyOfEditor</span><span class="T2">»</span><span class="T15">/&gt;</span></p>
<p class="P3"><span class="T15">         &lt;/owl:onProperty&gt;</span></p>
<p class="P3"><span class="T15">          &lt;owl:hasValue&gt;</span></p>
<p class="P3"><span class="T15">            &lt;RangeOfMainPropertyOfEditor  rdf:ID=</span><span
  class="T2"> »</span><span class="T15">Ontology</span><span class="T2">»</span><span class="T15">/&gt;</span></p>
<p class="P3"><span class="T15">          &lt;/owl:hasValue&gt;</span></p>
<p class="P3"><span class="T15">      &lt;/owl:Restriction&gt;</span></p>
<p class="P3"><span class="T15">    &lt;/rdfs:subClassOf&gt;</span></p>
<p class="P3"><span class="T15">  &lt;rdfs:comment</span></p>
<p class="P3"><span class="T15">rdf:datatype=</span><span class="T2"> »</span><a href="http://www.w3.org/2001/"
                                                                                 class="ListLabel_20_32"><span
  class="Internet_20_link"><span class="T16">http://www.w3.org/2001/</span></span></a><span
  class="T15">XMLSchema#string</span><span class="T2">»</span></p>
<p class="P3"><span class="T15">&gt;класс редакторов онтологий&lt;/rdfs:comment&gt;</span></p>
<p class="P3"><span class="T15">   &lt;rdfs:subClassOf  rdf:resource=</span><span class="T2"> »</span><span class="T15">#Editor</span><span
  class="T2">»</span><span class="T15">/&gt;</span></p>
<p class="P3"><span class="T15">   &lt;/owl:Class&gt;</span></p>
<p class="P3"><span class="T15">     &lt;owl:ObjectProperty  rdf:about=</span><span class="T2"> »</span><span
  class="T15">#MainPropertyOfEditor</span><span class="T2">»</span><span class="T15">&gt;</span></p>
<p class="P3"><span class="T15">     &lt;rdfs:domainrdf:resource=</span><span class="T2"> »</span><span class="T15">#Editor</span><span
  class="T2">»</span><span class="T15">/&gt;</span></p>
<p class="P3"><span class="T15">     &lt;rdfs:rangerdf:resource=</span><span class="T2"> »</span><span class="T15">#RangeOfMainPropertyOfEditor</span><span
  class="T2">»</span><span class="T15">/&gt;</span></p>
<p class="P3"><span class="T15">     &lt;rdfs:comment</span></p>
<p class="P3"><span class="T15">rdf:datatype=</span><span class="T2"> »</span><span class="T15"> </span><a
  href="http://www.w3.org/2001/XMLSchema#string" class="ListLabel_20_32"><span class="Internet_20_link"><span
  class="T16">http://www.w3.org/2001/XMLSchema#string</span></span></a><span class="T2">»</span></p>
<p class="P3"><span class="T15">     &gt;характерное свойство редактора</span></p>
<p class="P3"><span class="T15">(редактирует)&lt;/rdfs:comment&gt;</span></p>
<p class="P3"><span class="T15">    &lt;/owl:ObjectProperty&gt;</span></p>
<p class="P7"><span class="T15"> </span></p>
<p class="P7"><span class="T12">2. «Предмет с определением» или «adjective + subject», например словосочетание «abstract syntax» (абстрактный синтаксис). Для записи соответствующего OWL-кода необходимо провести рассуждения, аналогично предыдущему случаю.</span>
</p>
<p class="P7"><span class="T12">3. Простое предложение, subject + predicate + subject1 + preposition + subject2 (подлежащее, сказуемое, дополнение 1, предлог, дополнение 2), например «Ontology incorporate information about classes» (онтология объединяет информацию о классах).</span>
</p>
<p class="P7"><span class="T12">4. subject1 + are/is + noun + that/which/who + predicate + preposition + object (подлежащее, are/is, существительное, that/which/who, сказуемое, предлог, дополнение), например предложение «Decision Engineering is an emerging discipline that focuses on developing tools».</span>
</p>
<p class="P7"><span class="T12">Отдельно выделяются правила, которые сами не строят семантическую конструкцию, но определяют, каким образом (к каким словам) применять правила, непосредственно выявляющие семантические конструкции. Например, правило «Если сложный предмет состоит из трех и более простых, то нужно применять правило «noun1 + noun2» начиная с конца».</span>
</p>
<p class="P7"><span class="T12"> </span></p>
<p class="P7"><span class="T12">    Рассмотрим правило из примера 2, в которое по аналогии с примером 1 были бы введены свойство mainPropertyOfAbstract и класс RangeOfMainPropertyOfAbstract. Данные конструкции введены чисто формально, используя некие законы языка, однако данное свойство и класс имеют определенную семантику. Так определение Abstract характеризует некую особенность предмета Syntax. В данном случае эту особенность можно назвать, например, «степень детализации».</span>
</p>
<p class="P7"><span class="T12">  Если же подходить к анализу данного словосочетания с учетом семантики, указанные свойство и класс назывались бы «имеетСтепеньДетализации» и «СтепеньДетализации» соответственно.</span>
</p>
<p class="P7"><span class="T12">  Задача преобразования формальных семантических конструкций в конструкции, привязанные к семантике конкретной предметной области, на данный момент автором не решена. Для решения данной задачи требуется источник знаний со следующей структурой:</span>
</p>
<p class="P8"> </p>
<table border="0" cellspacing="0" cellpadding="0" class="Таблица1">
  <colgroup>
    <col width="212"/>
    <col width="238"/>
  </colgroup>
  <tr class="Таблица11">
    <td style="text-align:left;width:4.84cm; " class="Таблица1_A1"><p class="P14"><span class="T4">Слово</span></p></td>
    <td style="text-align:left;width:5.45cm; " class="Таблица1_B1"><p class="P14"><span
      class="T4">Характерное свойство</span></p></td>
  </tr>
  <tr class="Таблица11">
    <td style="text-align:left;width:4.84cm; " class="Таблица1_A1"><p class="P14"><span class="T4">Abstract</span></p>
    </td>
    <td style="text-align:left;width:5.45cm; " class="Таблица1_B1"><p class="P14"><span
      class="T4">Степень детализации</span></p></td>
  </tr>
  <tr class="Таблица11">
    <td style="text-align:left;width:4.84cm; " class="Таблица1_A1"><p class="P14"><span class="T4">Editor</span></p>
    </td>
    <td style="text-align:left;width:5.45cm; " class="Таблица1_B1"><p class="P14"><span class="T4">Редактирует</span>
    </p></td>
  </tr>
</table>
<p class="P8"> </p>
<p class="P7"><span class="T12">    Предполагается представить данный источник знаний в виде RDF-представления WordNet подобного ресурса [9] компьютерной лингвистики.</span>
</p>
<p class="P7"><span class="T12">     Для решения данной задачи предполагается получить правила, которые позволили бы выявить данную информацию, на основе статистики совместного использования слов, содержащих название понятия и его семантику.</span>
</p>
<p class="P7"><span class="T12">  Для того чтобы привязать полученную семантическую модель к конкретной предметной области, используется словарь соответствующей тематики. В итоговой онтологии фиксируются только те семантические конструкции, в которых участвуют термины из словаря предметной области. Словарь может создаваться экспертом или автоматически на основе статистических методов классификации.</span>
</p>
<p class="P7"><span class="T15"> </span><span class="T5">Онтология «SemanticWeb»</span></p>
<p class="P7"><span class="T2">    Для оценки метода автоматического построения онтологии авторы  создают онтологию предметной области «Semantic Web» без средств автоматизации. Онтология создается на основе того же корпуса англоязычных тестов, из которого выявляются правила построения семантической карты ресурса. Тексты корпуса исследовались следующим образом:</span>
</p>
<ul>
  <li><p class="P19" style="margin-left:1.27cm;"><span class="ListLabel_20_14"
                                                       style="display:block;float:left;min-width:0.635cm;">•</span><span
    class="T2">выявлялись понятия предметной области, и обозначающие их термины на русском и английском языках; </span><span
    class="T7"> </span><span class="T8"> </span><span class="odfLiEnd"/> </p></li>
  <li><p class="P19" style="margin-left:1.27cm;"><span class="ListLabel_20_14"
                                                       style="display:block;float:left;min-width:0.635cm;">•</span><span
    class="T2">каждое понятие дополнялось экспертным определением; </span><span class="T7"> </span><span
    class="T8"> </span><span class="odfLiEnd"/> </p></li>
  <li><p class="P19" style="margin-left:1.27cm;"><span class="ListLabel_20_14"
                                                       style="display:block;float:left;min-width:0.635cm;">•</span><span
    class="T2">выявлялись триплеты, содержащие найденные понятия; </span><span class="T7"> </span><span
    class="T8"> </span><span class="odfLiEnd"/> </p></li>
  <li><p class="P19" style="margin-left:1.27cm;"><span class="ListLabel_20_14"
                                                       style="display:block;float:left;min-width:0.635cm;">•</span><span
    class="T2">для каждого понятия и триплета фиксировался ресурс-источник. </span><span class="T7"> </span><span
    class="T8"> </span><span class="odfLiEnd"/> </p></li>
</ul>
<p class="P15"> </p>
<p class="P7"><span class="T2">  Для оценки программной реализации метода автоматического построения онтологии предполагается обработать исследуемый корпус полученным программным средством и сравнить результаты с онтологией, полученной ручным способом. Создан RDF словарь для хранения результатов ручной разработки онтологии, представляющий собой модель для хранения понятий с их определениями, триплетов и оригинальных источников понятий и триплетов.</span>
</p>
<p class="P3"><span class="T18"> </span></p>
<p class="P3"><span class="T18"> </span></p>
<p class="P3"><span class="T5">Семантическая разметка, RDF/A, GRDDL</span></p>
<p class="P7"><span class="T2">     RDF графы и онтологии на их основе могут размещаться в отдельных Веб-ресурсах, например файлах или RDF-хранилищах, доступ к которым осуществляется через RDF-сервера. Также RDF-графы могут встраиваться в другие XML-документы, например в XHTML. Встраивание RDF-данных в XHTML используется для спецификации семантики (семантической разметки) контента.</span>
</p>
<p class="P7"><span class="T2">    Семантическая разметка или аннотирование представляет собой явное описание семантики контента ресурса при помощи понятий семантической модели (онтологии или словаря). Такое явное описание семантики выполняется указанием четкого соответствия между определенной частью контента ресурса и его семантикой, описанной в семантической модели.</span>
</p>
<p class="P7"><span class="T2">   Рабочая группа развертывания семантического веба W3 консорциума разработала технологию RDF/A [10], которая позволяет встраивать RDF данные в XHTML. RDF/A является одним из множества микроформатов [11] или диалектов языков, расширений языка HTML, чтобы интерпретировать HTML-код, записанный таким образом, как RDF-данные.</span>
</p>
<p class="P7"><span class="T2">   Существуют микроформаты для записи таких словарей, как vCard, DC, RDF Calendar, RSS, GeoInfo. Все указанные словари записываются в виде RDF-графов, RDF/A является микроформатом для записи непосредственно RDF-синтаксиса и может быть использован для записи терминов любых RDF-словарей, например тех же vCard, DC, RDF Calendar, RSS, GeoInfo.</span>
</p>
<p class="P7"><span class="T2">  Приведем пример использования терминов словаря набора данных DC (словарь DC описывает метасвойства электронных документов) в XHTML.</span>
</p>
<p class="P10"> </p>
<p class="P3"><span class="T18">&lt;headprofile=</span><a href="http://www.w3.org/" class="ListLabel_20_33"><span
  class="Internet_20_link"><span class="T18">http://www.w3.org/</span></span></a><span
  class="T15">2003/g/data-view</span><span class="T12">»</span><span class="T15">&gt;</span></p>
<p class="P3"><span class="T18">&lt;link rel=</span><span class="T2"> »</span><span class="T18">schema.DC</span><span
  class="T2">»</span></p>
<p class="P3"><span class="T18">     href=</span><span class="T2"> »</span><span
  class="T18">http://purl.org/dc</span><span class="T2">»</span><span class="T18">/&gt;</span></p>
<p class="P3"><span class="T18">     &lt;metaname=</span><span class="T2"> »</span><span
  class="T18">DC.Title</span><span class="T2">»</span><span class="T18"> xml:lang=</span><span class="T2"> »</span><span
  class="T18">en</span><span class="T2">»</span></p>
<p class="P3"><span class="T18">lang=</span><span class="T2"> »</span><span class="T18">en</span><span
  class="T2">»  </span><span class="T18">content=</span><span class="T2"> »</span><span class="T18">Использование терминов словаря</span>
</p>
<p class="P3"><span class="T18">DC в XHTML коде</span><span class="T2">»</span><span class="T18"> /&gt;</span></p>
<p class="P3"><span class="T18">&lt;/head&gt;</span></p>
<p class="P7"><span class="T2">     Данный XHTML соответствует триплету, субъектом которого является URI самого ресурса, предикатом – свойство Title, описанное в словаре DC по адресу </span><a
  href="http://purl.org/dc" class="ListLabel_20_34"><span class="Internet_20_link"><span
  class="T14">http://purl.org/dc</span></span></a><span class="T2">, объектом – строка "Использование терминов словаря DC в XHTML-коде". Вставка такого RDF-триплета в заголовок HTML страницы позволит соответствующим приложениям понять название документа -"Использование терминов словаря DC в XHTML-коде".  При этом это название может отличаться оттого, которое представлено пользователю с помощью тега &lt;title&gt;. Таким образом, в XHTML можно вставлять любые RDF графы. Использование профиля profile= </span><a
  href="http://www.w3.org/2003/g/data-view" class="ListLabel_20_35"><span class="Internet_20_link"><span class="T2">http://www.w3.org/2003/g/data-view</span></span></a><span
  class="T2"> необходимо для возможности указания значения "transformation" у тега rel, что необходимо для указания ссылки на механизм GRDDL-извлечения (см. далее).</span>
</p>
<p class="P7"><span class="T2">  Для извлечения RDF данных из различных микроформатов W3 консорциум разработал технологию GRDDL [12] (Gleaning Resource Descriptions from Dialects of Languages - Извлечение Описания Ресурса из Диалектов Языков). Для работы GRDDL-скреперов (программ, извлекающих RDF-данные из XHTML) в XHTML коде необходимо указать ссылку на механизм извлечения:</span>
</p>
<p class="P7"><span class="T18">&lt;link rel=»transformation» href=http://www.w3.org/2000/06/dc-extract.xls/&gt;</span>
</p>
<p class="P7"><span class="T2">   Механизм извлечения основан на технологии преобразования XML-документов XSLT. В данном случае XHTML преобразуется в RDF.</span>
</p>
<p class="P11"><span class="T2"> </span></p>
<p class="P11"><span class="T2"> </span></p>
<p class="P5"><span class="T3">СПИСОК ЛИТЕРАТУРЫ</span></p>
<p class="P12"><span class="T3"> </span></p>
<ol>
  <li><p class="P20" style="margin-left:1.27cm;"><span
    style="display:block;float:left;min-width:0.635cm;">1.</span><span class="T13">Berners-Lee T.</span><span
    class="T12"> World Wide Web: Proposal forHyperText Project. 1990. //http://www.w3.org/Proposal.html</span><span
    class="T8"> </span><span class="odfLiEnd"/> </p></li>
  <li><p class="P20" style="margin-left:1.27cm;"><span
    style="display:block;float:left;min-width:0.635cm;">2.</span><span class="T12">Сообщество SemanticWeb //http://www.w3.org/2001/sw</span><span
    class="T8"> </span><span class="odfLiEnd"/> </p></li>
  <li><p class="P20" style="margin-left:1.27cm;"><span
    style="display:block;float:left;min-width:0.635cm;">3.</span><span class="T13">Gruber, T.R. </span><span
    class="T12">(1993) A translation approach toportable ontology specifications. KnowledgeAcquisition. Vol. 5.</span><span
    class="T8"> </span><span class="odfLiEnd"/> </p></li>
  <li><p class="P20" style="margin-left:1.27cm;"><span
    style="display:block;float:left;min-width:0.635cm;">4.</span><span class="T12">Swoogle - Semantic Web Search Engine. //http://swoogle.umbc.edu/</span><span
    class="T8"> </span><span class="odfLiEnd"/> </p></li>
  <li><p class="P20" style="margin-left:1.27cm;"><span
    style="display:block;float:left;min-width:0.635cm;">5.</span><span class="T13">Бениаминов Е.М.</span><span
    class="T12"> "Алгебраические методы в теории баз данных и представлении знаний". М.: Научный мир, 2003.</span><span
    class="T8"> </span><span class="odfLiEnd"/> </p></li>
  <li><p class="P20" style="margin-left:1.27cm;"><span
    style="display:block;float:left;min-width:0.635cm;">6.</span><span
    class="T12">Реестр товаров и услуг ООН. // </span><a href="http://www.unspsc.org/" class="ListLabel_20_34"><span
    class="Internet_20_link"><span class="T14">http://www.unspsc.org/</span></span></a><span class="T12">.</span><span
    class="T8"> </span><span class="odfLiEnd"/> </p></li>
  <li><p class="P20" style="margin-left:1.27cm;"><span
    style="display:block;float:left;min-width:0.635cm;">7.</span><span class="T12">RDF Schema 1.0, Язык описания RDF словарей. Рекомендация W3C 10 Февраля 2004. // </span><a
    href="http://www.w3.org/TR/rdf-schema/" class="ListLabel_20_34"><span class="Internet_20_link"><span class="T14">http://www.w3.org/TR/rdf-schema/</span></span></a><span
    class="T8"> </span><span class="odfLiEnd"/> </p></li>
  <li><p class="P20" style="margin-left:1.27cm;"><span
    style="display:block;float:left;min-width:0.635cm;">8.</span><span class="T12">Язык OWL. // </span><a
    href="http://www.w3.org/2004/OWL/" class="ListLabel_20_34"><span class="Internet_20_link"><span class="T14">http://www.w3.org/2004/OWL/</span></span></a><span
    class="T8"> </span><span class="odfLiEnd"/> </p></li>
  <li><p class="P20" style="margin-left:1.27cm;"><span
    style="display:block;float:left;min-width:0.635cm;">9.</span><span class="T12">RDF/OWL представление Word Net, Рабочий документ W3C 19 Июня 2006 </span><a
    href="http://www.w3.org/TR/wordnet-rdf/" class="ListLabel_20_34"><span class="Internet_20_link"><span class="T14">http://www.w3.org/TR/wordnet-rdf/</span></span></a><span
    class="T8"> </span><span class="odfLiEnd"/> </p></li>
  <li><p class="P20" style="margin-left:1.27cm;"><span
    style="display:block;float:left;min-width:0.635cm;">10.</span><span class="T12">Встраивание RDF в XHTML RDFa. Рабочий документ W3C 12 марта 2007. //http://www.w3.org/TR/xhtml-rdfa-primer</span><span
    class="T8"> </span><span class="odfLiEnd"/> </p></li>
  <li><p class="P20" style="margin-left:1.27cm;"><span
    style="display:block;float:left;min-width:0.635cm;">11.</span><span class="T12">Сообщество пользователей микроформатов. //http://microformats.org/</span><span
    class="T8"> </span><span class="odfLiEnd"/> </p></li>
  <li><p class="P20" style="margin-left:1.27cm;"><span
    style="display:block;float:left;min-width:0.635cm;">12.</span><span class="T12">Рабочая группа GRDDL </span><a
    href="http://www.w3.org/2001/sw/grddl-wg/" class="ListLabel_20_34"><span class="Internet_20_link"><span class="T14">http://www.w3.org/2001/sw/grddl-wg/</span></span></a><span
    class="T8"> </span><span class="odfLiEnd"/> </p></li>
</ol>
<p class="P9"> </p>
<p class="P13"> </p></body>
</html>