Классификация документов по содержанию – —

виды, методы и способы классификации документов в организации

Любая компания ежедневно сталкивается с необходимостью обработки десятков, если не сотен различных документов. Их классификация становится одним из самых важных процессов во входящем, исходящем и внутреннем документообороте. И чем больше поток документов, тем больше времени и трудозатрат требуется на то, чтобы его обработать. А если прибавить к «классическим» документам еще электронные письма и запросы, которые также требуют классификации и анализа, то задача усложняется в разы. Облегчить рутинную работу компании помогают интеллектуальные решения ABBYY.

Общие принципы классификации документов

Принципов классификации документов в делопроизводстве существует множество: по времени создания, по способу изготовления, по месту издания и даже по уровню секретности. Однако наиболее востребованными в практической работе в организациях все же являются два способа — по сфере использования документа и по его содержанию.

По сфере использования все документы можно разделить на несколько подгрупп:

  • организационно-правовые, к которым относятся договора, уставы, положения, должностные инструкции, штатное расписание;
  • распорядительные — приказы, постановления, распоряжения, решения;
  • учетно-расчетные (бухгалтерские) — счета-фактуры, накладные, платежные поручения, акты, приходные ордера;
  • информационно-справочные — служебные записки, справки, письма, протоколы, докладные, объяснительные;
  • нормативные — нормы, своды правил, стандарты, руководящие документы, регламенты и пр.
  • коммерческие контракты или договоры.

Классификация документов

по содержанию, или семантическая классификация, — это тот случай, когда для понимания того, к какой группе относится документ, необходимо сначала его прочитать. Например, чтобы понять, что у вас в руках именно договор, а не приложение к нему, необходимо изучить хотя бы первый абзац.

При этом каждый документ может быть одновременно классифицирован и по типу, и по содержанию. Сотрудникам, ответственным за обработку, необходимо определить тип документа, перевести бумажный документ в электронный, ввести его в систему, а при необходимости направить в соответствующее подразделение. Ручная обработка документов нередко приводит к появлению ошибок ввода, искажению данных, что абсолютно недопустимо, если компания хочет занимать достойное место на рынке.

То же самое происходит и с клиентскими запросами или электронными письмами. Отправив запрос, человек ожидает, что на него придет ответ, причем достаточно быстро. По утверждению Джея Баэра, консультанта по маркетингу из США, почти 30% клиентов ожидают ответа на свои запросы в течение получаса, а более половины уверены, что компания обязана отвечать и в выходные дни и даже в ночное время. Несвоевременные ответы на запросы заметно снижают уровень доверия к компании.

На заметку

По данным Accenture, 83% клиентов готовы уйти к конкурентам в том случае, если их не устроит уровень сервиса[1]

.

Что же можно сделать, чтобы упростить процесс классификации и повысить качество обработки документов? Ответ на этот вопрос кроется в решениях ABBYY.

Решения ABBYY: оптимизация бизнес-процессов на всех уровнях

Оптимизировать основные бизнес-процессы в самых разных отраслях бизнеса и в самых разных подразделениях компаний — задача решений ABBYY. Они подойдут для усовершенствования работы делопроизводителей, секретарей, бухгалтеров, специалистов службы поддержки или работы с клиентами в банковской сфере, энергетике, нефтегазовой отрасли.

Технология оптического распознавания текстов ABBYY OCR дает возможность идеально точно конвертировать бумажные документы или их сканы, фотографии и PDF-документы любого типа в редактируемые форматы, такие как Microsoft® Word, Excel® и PowerPoint®, OpenOffice™, Writer и другие.

ABBYY Compreno — уникальная технология для анализа и понимания текстов на естественных языках. В отличие от классических систем, базирующихся на статистике и жестких правилах, она способна производить полный семантико-синтаксический анализ текста, анализируя события и связи. Благодаря такому глубокому анализу существенно увеличивается полнота и качество значимой для компании информации. С помощью ABBYY Compreno можно проводить классификацию документов по содержанию, поиск документов, похожих по смыслу, их аннотирование и реферирование.

Важно!

С помощью интеллектуальных решений ABBYY вполне возможно круглосуточно отвечать на вопросы, прибегая к помощи службы поддержки только в экстренных случаях. При получении текстового запроса по любому из каналов, технология анализирует обращение, понимает его смысл и формирует автоматический ответ, основываясь на собранных ранее электронных письмах, платежах и звонках клиентов. Такой разносторонний анализ дает возможность реагировать на запросы практически моментально и даже давать персонифицированные ответы.

  1. ABBYY FlexiCapture Engine встраивается в платформу клиента и используется для классификации любых документов с помощью оптического распознавания символов, меток, интеллектуальной обработки печатных документов. Отсканированные документы поступают единым потоком, а система автоматически анализирует и классифицирует их, к какому бы типу они не принадлежали — счета-фактуры, контракты, статьи, письма, клиентские запросы и т. д. ABBYY FlexiCapture Engine позволяет классифицировать структурированные документы, поля которых совпадают на просвет — исследования, бланки, опросники. Для этого используются определенные и созданные заранее шаблоны для всех типов документов. С помощью шаблонов в документах распознаются стандартные поля, метки и штрих-коды. Кроме того, решение классифицирует и неструктурированные документы, такие как платежные поручения, акты выполненных работ, счета-фактуры. Для их обработки применяются гибкие описания, на основе которых система извлекает даты, числа, строки текста, таблицы и т. д. При помощи всего лишь одного гибкого описания программа способна найти все необходимые поля на счетах разного формата, поступивших от разных клиентов. ABBYY FlexiCapture Engine успешно классифицирует документы, заполненные как на компьютере, так и от руки. Решение будет особенно
    полезно финансовым организациям
    , поскольку дает возможность быстро классифицировать документы разных типов и вводить их в информационную систему.
  2. ABBYY FlexiCapture.
    Решение используется для обработки информации из любых типов документов. Ни формат, ни размер, ни источник происхождения в данном случае роли не играют. ABBYY FlexiCapture способно классифицировать все входящие документы как по содержанию, так и по внешнему виду. Решение комбинирует два вида интеллектуальной классификации:
    • классификацию по изображению, основанную на машинном обучении и сортирующую документы по внешнему виду или расположению элементов в них;
    • классификацию по содержанию документа.

    Применение ABBYY FlexiCapture будет очень эффективным во всех компаниях, где есть документооборот, но особенно оно подойдет для крупных организаций, где на классификацию документов и клиентских запросов расходуется много времени.

  3. ABBYY Smart Classifier SDK — это решение на базе технологии ABBYY Compreno, позволяющее решать задачи классификации неструктурированных текстовых документов на основе их содержания. С его помощью можно автоматически распределять поток входящих документов, классифицировать их и легко находить в корпоративной системе. Решение может быть полезно, например, для работы службы технической поддержки. В этом случае оно проводит классификацию всех клиентских запросов соответственно их проблематике и составляет автоответ. Если автоответа недостаточно, то при помощи решения запрос перенаправляется компетентному сотруднику. Кроме того, решение способно обрабатывать и классифицировать запросы клиентов, поступающие в компанию в бумажном или электронном виде. Поток входящих запросов также анализируется, определяются темы запросов, профильные подразделения и сотрудники, ответственные за рассмотрение обращения. Использование ABBYY Smart Classifier SDK в государственных и коммерческих организациях позволяет повысить эффективность бизнес-процессов, снизить риски утечки или утраты важной информации и оптимизировать затраты на обработку документов.

Эти три продукта, в сущности, решают одну задачу — классифицируют документы, но в зависимости от персональных потребностей заказчик сам выбирает, что оптимально подходит именно ему.

Интеллектуальные решения ABBYY дают возможность избавиться от ручной категоризации документов, быстро находить в системе нужные документы, контролировать доступ к конфиденциальной информации. Решения способны автоматически распределять все документы по определенным категориям — содержанию, назначению, ответственному подразделению, отрасли и уровню секретности. Как утверждают специалисты, с применением «умных» технологий ABBYY процент отказов от услуг компании значительно снижается, поскольку у сотрудников высвобождается время на работу с клиентами и повышается качество их обслуживания.

www.kp.ru

28. Классификация документов по мерности записи информации

Особенностью носителя информации есть и такой при­знак, как мерность записи информации. Ею определяется место, занимаемое документом (его материальной основой) в пространстве.

По этому признаку различают одно-, двух- и трехмерные (объемные) документы. В одномерной среде запись информа­ции осуществляется азбукой Морзе (двоичный код) «в строч­ку» или в линейной последовательности.

Однако абсолютное большинство документов — двухмер­ные, имеющие размер (формат) и объем (количество стра­ниц). Запись информации на этом носителе представляет собой два измерения. Это буквы, цифры, ноты, графическое и художественное изображение, штриховое кодирование, зву­ковые бороздки магнитной ленты. В трехмерной среде запи­сываются голограммы и частично растровая печать (кален­дарики с мигающим изображением).

29. Классификация документов по предназначенности для восприятия информации

Информация, зафиксированная в документе с помощью определенных знаковых средств, может быть воспринята че­ловеком как непосредственно, так и опосредованно.

По субъекту восприятия семантического содержания все документы делят на человекочитаемые — они могут быть «прочитаны» непосредственно человеком, без специальных технических средств — и машиночитаемые — предназна­ченные для автоматического воспроизведения информации, находящейся в документе, с помощью магнитофона, телеви­зора, принтера, дисплея и т. п.

К человекочитаемым документам относятся все виды изданий (книга, журнал, газета и т. д.). Машиночитаемые документы — это микрофильм, микрофиша, диафильм, магнит­ная лента, грампластинка, перфокарта, перфолента, диск, дис­кета, компакт-диск и т. д. на машиночитаемых носителях, запись на которых осуществляется путем изменения струк­туры носителя. По их внешнему виду человек ничего не может сказать о характере записи в таких документах, пото­му что она выполнена каким-либо техническим способом (например, изменением глубины звуковой дорожки в грам­пластинке).

30. Классификация документов по каналу восприятия информации

Информация, содержащаяся в документе, может воспри­ниматься с помощью различных органов чувств (зрение, слух, осязание).

По каналу восприятия знаков, используемых для записи содержания, различают визуальный, тактильный, аудиальный и аудиовизуальный документы.

Визуальный — это документ, содержание которого чело­век (реципиент) воспринимает зрением (письменные тексты, графики, рисунки, чертежи, фотографии, репродукции и т. д. на любом носителе, включая экран диапроектора, телевизора или ЭВМ). Содержание тактильного документа восприни­мается через прикосновение (осязание) (книга, журнал для слепых). Аудиальный — это звуковой или слышимый доку­мент, содержание которого может быть воспринято только слухом (грампластинка, магнитная фонограмма, музыкаль­ный компакт-диск). Аудиовизуальный документ — тот, со­держание которого воспринимается одновременно зрением и слухом (звуковой кинофильм, озвученный диафильм, ви­деофильм, видеодиск, компьютерная технология «мультиме­диа» и т. д.).

По подсчетам специалистов, до 75% всей информации человек получает через органы зрения. Аудиальная инфор­мация составляет 13% от всей поступающей информации через органы чувств человека

.

  1. Классификация документов по степени их распространенности

По степени распространенности различают опубликован­ный, неопубликованный и непубликуемый документы.

Документ, предназначенный для широкого и многократ­ного использования, имеющий тираж (независимо от способа тиражирования), а также выходные данные, называют опуб­ликованным. Неопубликованный документ содержит инфор­мацию, не предназначенную для широкого распространения, поэтому он, как правило, не тиражируется и существует в ограниченном числе машинописных экземпляров. Предста­вителями этого класса документов являются отчет о НИР и ОКР, диссертация, информационная карта, депонированная рукопись, репринт и др. К непубликуемому относят доку­мент однократного использования, необходимый для приня­тия конкретных управленческих решений (административ­но-хозяйственная, планово-экономическая, финансово-бухгал­терская, технологическая, коммерческая и прочая подобная документация).

  1. Классификация документов по способу документирования

По способу документирования (или закрепления инфор­мации на носителе) выделяют рукописный, печатный, меха­нический, магнитный, фотографический, оптический, лазер­ный и электронный документы.

Рукописный — это письменный документ, при создании которого знаки письма наносятся от руки. В этом смысле рукописью или рукописным документом можно назвать не только словесный текст, записанный «от руки», но и произ­ведение изобразительного искусства, а также чертеж или карту. К рукописям относят также документы, оформлен­ные средствами машинописи (с помощью пишущей машин­ки ) или ЭВМ (с помощью принтера). К рукописным доку­ментам относят: отчет о НИР и ОКР, депонированную руко­пись, диссертацию и др.

Печатный — это документ, изготовленный полиграфиче­ским или другим способом (наборным, средствами опера­тивной полиграфии, копировально-множительной техникой, средствами печати ЭВМ и др.). Такие документы выпуска­ются издательствами или типографиями. На печатном до­кументе запись информации производится, главным обра­зом, путем нанесения красочного слоя на его поверхность. Но может быть применен и другой способ: тиснение или вы­давливание знаков шрифта Л. Брайля в книгах для слепых. В настоящее время печатный документ — самый распрост­раненный класс документов: он включает книги, брошюры, газеты, журналы, календари, карты и т. п. Такие документы часто называют произведениями печати или изданиями.

Механический — это документ, запись информации на котором осуществляется механическим способом: путем вы­резания резцом канавки на поверхности движущегося носи­теля (грампластинки, фонографические валики, грамориги- налы) или путем пробивки отверстий (перфораций) с помо­щью перфоратора (перфокарты, перфоленты) и т. п.

Магнитный — это документ, запись информации на кото­ром осуществляется путем изменения магнитного состоя­ния поверхности носителя под влиянием магнитного поля. К магнитному документу относятся магнитные ленты, диски или дискеты для ЭВМ, видеодиски и т. п.

Фотографический — это изобразительный документ, со­зданный фотографическим способом, основанным на измене­нии оптической плотности участков фотоматериала (фото-, кинопленка, фотобумага) под воздействием светового или электронного луча, интенсивность и форма которого изменя­ются в соответствии с записываемым сигналом (фотографии, диафильмы, диапозитивы, кинофильмы, микрофиши, микро­фильмы).

Оптический — это документ, запись информации на ко­тором осуществлена сфокусированным пучком электромаг­нитного поля оптического излучения (компакт-диск, СБ-КОМ, фотодокументы с оптической записью, постоянное запомина­ющее устройство (ПЗУ)).

Лазерный — это документ, запись и считывание инфор­мации на котором осуществлены посредством лазерного луча (оптический диск, СБ-КОМ, компакт-диск, голограмма).

Формируется еще один самостоятельный класс докумен­тов — электронный документ как совокупность данных в памяти ЭВМ. Это документ с записью звука или информа­ции для ЭВМ. Основным способом документирования здесь выступает не письменность, а экранность, основанная не на линейном, т. е. вытянутом в строку письме, а на временном потоке экранных изображений (электронная книга, электрон­ный журнал, диск). Воспроизведение текста ЭВМ осуществ­ляется двумя путями: изображение его на экране дисплея или в виде текстовой распечатки.

  1. . Классификация по физической (материальной) составляющей документа

Вторая атрибутивная составляющая документа — его ве­щественная (субстанциональная) форма, материальная осно­ва носителя информации, особенности которого составляют вторую группу относительно самостоятельных оснований деления документов на виды и подвиды по материалу носи­теля информации, по материальной конструкции и др.

  1. . Классификация документов по материалу носителя информации

По материалу носителя информации выделяют классы документов на искусственной и естественной материальной основе.

Основными разновидностями современных документов на искусственном носителе являются бумажные и полимерные (полимерно-пленочные и полимерно-пластиночные) документы.

Бумажный документ выполнен на бумаге или на других материалах, по своим свойствам схожих с бумагой (папирус, пергамент или современные синтетические заменители бу­маги). К классу бумажных документов относят книги, жур­налы, газеты, ноты, карты, патенты, нормативные документы и др. виды изданий, а также перфокарты, бумажные перфо­ленты, фотографии и т. п.

Пленочный документ создан на пленочной основе (кино-, диафильм, диапозитив, микрофиша, магнитная фонограмма, документ с записью информации для ЭВМ).

Пластиночные документы созданы на пластмассовой ос­нове (грампластинки, диски). В отдельных случаях они со­здаются на металлической или стеклянной основе.

До изобретения искусственных носителей информации ее записывали на естественных материалах: глине, древесной коре, траве (папирус), коже (пергамент), камне и др. Однако сейчас естественные материалы в качестве носителя инфор­мации используются весьма редко.

  1. Классификация по материальной конструкции или форме носителя информации

Каждый документ имеет определенную внешнюю форму своего материального носителя. Именно по форме (конструк­ции) документа на обыденном уровне отличают книгу от газеты, грампластинку от дискеты и т. п., имея при этом в виду, что документ изготовлен в форме книги, диска, магнит­ной ленты и др.

По материальной конструкции носителя информации выделяют: документ листовой, кодексовый, карточный, лен­точный, дисковой, комбинированный.

Листовой — это документ в виде одного или несколь­ких листов любого формата без их скрепления (листовка, газета, плакат, географическая карта, афиша, этикетка). Ли­сты, положенные один на другой, образуют стопу (колода карт, картотека, каталог). Соединенная по длине стопа стано­вится кодексом. Кодексовый или блочный документ создан в форме блока — кодекса, т. е. скрепленных между собой по одному краю листов — страниц (книжный блок, альбом, атлас, журнал).

Карточный — это документ, состоящий из совокупности карточек или перфокарт установленного формата (каталож­ная, почтовая, игральная, перфорированная карты, календа­рик, открытка).

Ленточный — это документ, представляющий собой не­прерывную полосу материала с записью информации. Ленту можно свернуть в виде свитка или рулона или сложить час­тями, в форме гармошки. Она распространена как книга- ширма, шпаргалка, принтерная лента. К ленточным доку­ментам относят также свиток папируса, перфоленту, магни­тофонную, кино-, видеоленту и т. п.

Документы, имеющие форму ленты или нитки, хранятся в барабане, бобине, катушке или кассете.

Катушка — смешанное устройство с боковыми ограничи­телями, предназначенное для наматывания носителя записи или сигналограммы. Кассета — сменный прибор в виде ко­робки, содержащий одну или две катушки, сердцевину, носи­тель записи, имеющий форму диска. Барабан — запоминаю­щее устройство, в котором носителем информации является магнитный слой на поверхности вращающегося цилиндра — барабана. Бобина — катушка для намотки магнитной ленты или кинопленки.

Из-за большой длины (до сотни метров или даже кило­метров) хранить ленту в развернутом виде непрактично, ее скручивают либо на плоскости (катушка, кассета, бобина), либо спирально по грани в виде диска.

Дисковый документ — носитель записи информации в форме диска, т. е. скрученный в спираль последовательный ряд знаков (пластинка, диск, дискета, компакт-диск, СБ-КОМ, видеодиск). Местом размещения информации являются кон­центрические дорожки (магнитные, магнитооптические и оптические диски, грампластинки). Дискета — малоформат­ный магнитный диск, применяемый в ПЭВМ и терминаль­ном оборудовании, обычно на гибкой подложке. Диски по­мещают в кассету либо дискассету — вид кассеты, содержа­щий носитель записи или сигналограмму в форме диска.

Комбинированный документ соединяет в себе две или более форм носителей информации (комплект, состоящий из книги и кассеты, набора слайдов и грампластинки и т. п.).

  1. Классификация документов по обстоятельствам их бытования во внешней среде

Общим признаком классификации, не относящимся ни к содержанию, ни к форме документа, является признак де­ления совокупности документов по обстоятельствам их бы­тования во внешней среде, т. е. во времени и пространстве. Сюда относят: регулярность выхода в свет, место и время появления документа во внешней среде и др.

studfiles.net

Комплексная схема классификации документов, Классификация документов по информационной составляющей

Классификация документов по информационной составляющей

Основные признаки классификации сведены в таблицу 33

. Таблица 33. Основные признаки классификации документов по информационной составляющей

Основные признаки классификации

1

Характер знаковых средств фиксации информации

2

Измерение записи информации

3

Призначенисть для восприятия информации

4

Канал восприятия информации

5

Степень распространенности информации

6

Уровень отделки время

7

Содержание документа

8

Характер социальной информации, содержащейся в документе

Рассмотрим ее более подробно:

1. Классификация документов по характеру знаковых средств фиксации информации

Содержащаяся в документе фиксируется путем различных знаков. Знаковость — обязательное свойство документа, потому что только в закодированной знаками форме возможно передать информацию от ре еципиента к коммуникантаа.

По этому признаку различают текстовые, иконические, идеографические, звуковые, матричные, цифровые и комплексные документы

2. Классификация документов по измерением записи информации

По этому признаку различают одно -, двух — и трехмерные документы (перфолента, служебное письмо, глобус)

3. Классификация документов по призначенистю для восприятия информации

По этому признаку различают документы, читаемые человеком, и те, которые читаются с помощью технических средств (с помощью магнитофона, телевизора, электронно-вычислительной техники, сотовой т проч.

4. Классификация документов по каналу восприятия информации

Содержащаяся в документе, может восприниматься с помощью различных органов чувств. По этому признаку различают следующие виды документов: визуальные, тактильные, аудиальные, аудиовизуальные

5. Классификация документов по степени распространенности информации

По степени распространенности информации документы делятся на: опубликованные, неопубликованные, непубликовани и электронные

6. Классификация документов по уровню обработки время

В данной классификации выделяют первичные и вторичные документы по времени появления в мире

7. Классификация документов по содержанию

К содержательной классификации документов относятся:

А. Десятинная классификация. Мелвилла. Дьюи

(ДКД, Dewey Decimal Classification, DDC)

Универсальная классификационная система, разработанная в 1876 г. американским библиотекарем. М. Дьюи (1851 — 1931рр). Предназначалась для систематического размещения книг в публичных библиотеках. США. В первых изданиях х имела целью лишь перечисление документов, однако с самого начала содержала элементы скрытой типизации. Впоследствии типичные распределения выделились в самостоятельные вспомогательные таблицы и система приобрела комбинации йний харакрактер.

Состоит система из основных таблиц (Schedule) и вспомогательных таблиц (Tables). Составными частями полного издания также Relative Index (дословно:»указатель семейных отношений») -. АПУ и Manual (Кер ство), в котором представлен полный методический комментарий к таблицам (частная методика систематизацииематизації).

ДКД — распространенная в мире классификационная система, применяется в 135 странах. На своей родине, в. США,. ДКД используют 95% публичных и школьных библиотек, 25% от общего числа библиотек колледжей и университетов, 20% специальных библиотек. ДКД переведена на 30 языков мирту.

1-е издание. ДКД-1876 (44 а), 2-е — 1885 г (314 с). При жизни. М. Дьюи было опубликовано 12 изданий. В 1896. М. Дьюи создал Forest Press Foundation, которому передал права издания и развития. ДКД. Европе аналогичные права были переданы. Международному библиографическом институтатитуту).

20-е издание опубликовано в 1989 г. в 4-х т (3378 а), 21-е — в 1996 г. переведен на русский язык

В 1980 г. OCLC (Online Computer Library Center, Ohio) приобрел Forest Press и создал издательство OCLC Forest Press, выпускающего издания. ДКД 20-е издание. ДКД подготовлено полностью с помощью компьютер. Эрно техники. В 1993 г. вышел в свет оптический диск (CD-ROM)»Electronic Dewey DDC 20″, в 1996 p — оптический диск Windows DC 2к Windows DC 21.

Все подписчики изданий. ДКД бесплатно получают полный комплект дополнений, выпускаемых и исправлений -«Dewey Decimal Classification, Additions, Notes and Decisions (DC

Б. Универсальная десятичная классификация

(УДЮ. УДК представляет собой иерархическую комбинированную систему на основе»Десятинной классификации»и состоит из трех частей — основных таблиц, определяющих таблиц и буквенно-предметного указателя разработают ена в 1895-1905 pp в. Международном библиографическом институте в. Брюсселе под руководством бельгийских ученых потли и. АЛафонтента. А.Лафонтена.

В 1956 г. в. СССР был создан. Всесоюзный институт научной и технической информации, становится членом. Международной федерации по документации, получает эталон таблиц. УДК. Специалисты знакомятся с таблицами. УДК, в совершенствовании которых в соответствии с. Правилами. УДК могут участвовать многие страны мира — члены. Международной федерации. Если замечаний или возражений не поступало в течение четырех месяцев, проект ав тически принимался и входил в очередной выпуск»Extensions and corrections to the UDC»(Дополнения и исправления к. УДК, публикуются с 1950 года з 1950 року).

В начале с70-х годов XX века в стране формируется сеть органов научно-технической информации (НТИ). Согласно рекомендациям. Всероссийского совещания работников. НТИ,. Совет. Министров. СССР 14 мая 1962 издает. Постановление (№ 445)»О мерах по улучшению организации научно-технической информации в стране», в п5 которого говорится:»Ввести с 1963 года в научно-технических издательствах, редакциях науч о технических журналов, в организациях научно-технической информации, научно-технических библиотеках обязательную классификацию всех публикаций по универсальной десятичной системедесятковій системі».

Границы применения. УДК были расширены за счет медицинских и сельскохозяйственных библиотек и всей сети органов информации без ограничений по отраслевому признаку

В 1963-1966 гг централизованными усилиями библиотек и органов. НТИ осуществляется первое издание. УДК на русском языке. Перевод проявляется в ряде мест неадекватным, отдельные выпуски выданные в разной полигр рафичному исполнении с многочисленными пробелами. Принимается решение публиковать отраслевые таблицы. УДК (выходят в свет с 19644р.).

В 1966 г.. Комитета стандартов, издательству стандартов и снова организованном. Всесоюзном института научно-технической информации (по стандартизации), классификации и кодированию поручена подготовка второго в издание таблиц. УДК на русском языке. Издание выпущено в 1969-1970гг с авторизованным номером. Международной федерации № 447 в 6-ти томах 9-ти книгагах.

В 1982-1987гг публикуется третье издание. УДК на русском языке (№ 572) в 7-ми вып 11-ти книгах. Одновременно выходят в свет продолжающиеся выпуски»Новое в. УДК», содержащие страницы с дополнениями и ис еннямы. В 1969 г. выпущено издание. УДК в одном томК в одному томі.

С 1997. НТЦ»Ректор», получивший право перевода, издания и распространения таблиц. УДК в. России и. СНГ, выдает полный перевод эталона. УДК на русском языке. Новые таблицы публикуются под названием»Универсальная где есятинна классификация. Четвертое полное изданиерте повне видання».

К концу 2000 г вышло в свет 3 тома, всего предполагается 10 томов, в двух дополнительных томах будет опубликован алфавитно-предметный указатель

В. Библиотечно-библиографическая классификация (ББК)

В основу. ББК положена иерархическая комбинированная система библиотечно-библиографической классификации, состоящей из основных таблиц, таблиц типовых делений и алфавитно-предметного указателя. ББК (общее ьни типовые деления, территориальные типовые деления в двух таблицах — для естественных наук и для социально-экономических и гуманитарных наук, специальные типовые деления т.д..

Первое издание. ББК на территории. СССР для научных библиотек (1960-1968 гг) в 25 выпусках имело четкую структуру. Универсум знаний был разделен на три комплекса: естественные науки -. Б /. Е (выпуски 3-6), примером адни науки -. Ж /. Р (выпуски 7-13), общественные и гуманитарные науки — 3 /. Ю (выпуски 14-233).

Перечень основных распределений начинался разделом. А. Марксизм-ленинизм (выпуск 1), завершался разделом. Я. Литература универсального содержания (выпуск 25). Таким образом, основные таблицы классификации занимали 23 3 выпуска издания, начинался выпуском. И. Ввод и заканчивался выпуском 25. Типичные распределения. Прикладные науки:. Ж /. Об. Техника. Технические науки (выпуски 7-11),. П. Сельское и лесное хозяйство. Сельского сподарського и лесохозяйственные науки (выпуск 12) и. Р. Охрана. Медицина (выпуск 13к 13).

Гуманитарные науки начинались с выпуска 19. Ч. Культура. Наука. Образование. Три выпуска возглавляли соответствующие отраслевые комплексы: выпуск. С. Е. Естественные науки в целом, выпуск 7, часть 1. Ж. Техника. Технические наук ки в целом и выпуск 14, часть 1. С. Общественные науки в целом. Несмотря на то, что общий план системы предполагал выпуск 16. Ф. Политика. Политические партии, разногласия в группе разработчиков не позволила и выпустить в свет таблицы по политическим наукам в полном объеме. Выпуск 16 первого издания. ББК был назван. Ф5 / 6. Политические партии. Общественно-политические организацииорганізації.

В науке в целом не было в то время решен вопрос о правомерности социологии, генетики и многих других наук. Создателям. ББК удалось оставить в структуре таблиц резервные индексы на своем логическом м месте (например, для социологии — 35) для многих»непризнанных»или запрещенных по тем или иным соображениям наук, дисциплин и проблен і проблем.

Г. Единая классификация литературы

Состоит из основных таблиц и алфавитно-предметного указателя и предназначена для систематизации произведений печати в изданиях библиографии и для комплектования каталожных картотек по подписными сериями. Н. На ее основе составляются специальные таблицы, используемые отделами статистики печати книжных палат при систематизации книг за содержанием.

Существуют также классификации для отдельных видов документов, например, классификатор государственных стандартов,. Международная классификация изобретений и т.д.

В любом случае в содержательных классификациях деление на виды происходит по семантическому показателем, т.е. по содержанию (отраслям знаний, темам, предметом изложения, освещенным проблемам, родами, жанрами и произведений и т.д..

8. Классификация документов по характеру социальной информации

По характеру социальной информации, содержащейся в документе, различают следующие их виды: массовые, специальные и личные

При этом одна часть документов относится к сфере регулирования жизнедеятельности личности, общества и государства (документация официального происхождения)

Вторая — отражает духовную жизнь общества (документы, возникающие в личной жизни и творчества — литературные произведения, мемуары, письма, дневники, записные книжки и т.п.)

Рассмотренные выше основные характеристики видов документов по их информационной составляющей для большей наглядности сведены в таблицу 34

. Таблица 34. Классификация документов по информационной составляющей

Блок-фасет

Вид документа

Основные признаки

1

2

3

4

И

По характеру

знаковых

средств

11 Текстовый

Документ, содержание которого зафиксировано с помощью письменных знаков

12 нетекстовых

Документ, содержащий информацию в виде изображения объекта (реальное или условное), звука или матричного языка

121 Иконографический

Документ, в котором знак подобен отраженного объекта (рисунок, фотография, кинофильм, диафильм и т.д.)

122 Идеографическое

Документ, в котором знаком является условное обозначение, которое не отражает реальных предметов или явлений (карты, ноты, чертежи)

123 Звуковой

Документ, передает информацию звуками Это фонодокумент (грампластинка, магнитная запись, музыкальный компакт-диск)

124 Матричный

Документ, выполненный средствами»матричного языка»; т.е. состоит из кодированных отверстий-матриц, с помощью которых отображается кодирования информации в

виде, доступном для «прочтения» машиной (перфокарты, перфоленты)

13 Цифровой

Документ, в котором знаки и изображения представлены в цифровом

машиночитаемом виде

14 Комплексный

Документ, объединяющий два или более средств фиксации информации (например, фонетико-разговорный курс иностранного языка, состоящий из учебника, газеты и компакт-диска с сочетанием звукового текста и и изображения

2

По измерением

записи

информации

21 Одномерный

Документ, запись информации на котором осуществляется азбукой Морзе»в ленту»или в линейной последовательности

22 Двумерный

Документ, имеющий размер (формат) и объем (количество страниц)

23 Трехмерный

Документ, имеющий размер, объем и объем (объемное изображение)

3

По

назначению восприятия

31 Тот, что

читается

человеком

Документ, смысл которого понятен для человека

32 Тот, что читается с помощью технических средств

Документ, представлены в цифровом виде для восприятия

компьютерной техникой

4

По каналом восприятия человеком

41 Визуальный

Документ, содержание которого воспринимается зрением (тексты, графики, рисунки, чертежи, фотографии, репродукции)

42 Тактильный

Документ, воспринимается путем прикосновения

43 Аудиальный

Звуковой документ, содержание которого может быть воспринято только органами чувств (слухом)

44Аудиовизуаль ный

Документ, содержание которого воспринимается одновременно зрением и слухом (звуковая кинолента, диафильм, видеофильм, видеодиск,»мультимедиа»и т.д.)

5

По степени распространенности (кроме электронных)

51 Опубликовано

Документ, предназначенный для многоразового использования и имеет определенный тираж (тираж) и выходные данные

52 Неопубликованный

Документ, содержащий информацию, не предназначенную для распространения (Не тиражируется и существует в ограниченном количестве машинописных экземпляров) Это диссертации, информационные карты, депонированные рукописи и т.д.

53 Непубликований

Документ, имеющий одноразовое использование, необходимое для принятия управленческого решения (хозяйственные, планово-экономические, финансово-учетные, коммерческие и др.)

6

По уровню обработки время

61 Первичный

Документ, информация на котором есть изложением (описанием) результатов обработки, исследования

62 Вторичный

Документ, который является результатом аналитико-синтетической переработки одного или нескольких документов

7

По содержанию

Критерии разделения: содержание область знаний, тему, предмет, проблема

8

По характеру

социальной

информации

81 Массовый

Документ, содержащий эстетическую, религиозную или бытовую информацию

82 Специальный

Документ, содержащий социально — политическую, научно-техническую или экономически финансовую информацию

83 Личный

Документ личного характера (частные письма, дневники)

Сводная классификация документов по информационной составляющей представлена ??на схеме 32

uchebnikirus.com

Классификация документов — Википедия

Материал из Википедии — свободной энциклопедии

Классификация документов — одна из задач информационного поиска, заключающаяся в отнесении документа к одной из нескольких категорий на основании содержания документа.

Классификация может осуществляться полностью вручную, либо автоматически с помощью созданного вручную набора правил, либо автоматически с применением методов машинного обучения.

Следует отличать классификацию текстов от кластеризации, в последнем случае тексты также группируются по некоторым критериям, но заранее заданные категории отсутствуют.

Существует три подхода к задаче классификации текстов[1].

Во-первых, классификация не всегда осуществляется с помощью компьютера. Например, в обычной библиотеке тематические рубрики присваиваются книгам вручную библиотекарем. Подобная ручная классификация дорога и неприменима в случаях, когда необходимо классифицировать большое количество документов с высокой скоростью.

Другой подход заключается в написании правил, по которым можно отнести текст к той или иной категории. Например, одно из таких правил может выглядеть следующим образом: «если текст содержит слова производная и уравнение, то отнести его к категории математика». Специалист, знакомый с предметной областью и обладающий навыком написания регулярных выражений, может составить ряд правил, которые затем автоматически применяются к поступающим документам для их классификации. Этот подход лучше предыдущего, поскольку процесс классификации автоматизируется и, следовательно, количество обрабатываемых документов практически не ограничено. Более того, построение правил вручную может дать лучшую точность классификации, чем при машинном обучении (см. ниже). Однако создание и поддержание правил в актуальном состоянии (например, если для классификации новостей используется имя действующего президента страны, соответствующее правило нужно время от времени изменять) требует постоянных усилий специалиста.

Наконец,

ru.wikipedia.org