Андрій Бруснікін про архіви НТКУ: Майже весь радянський телерадіоспадок не оцифрований
Виділіть її та натисніть Ctrl + Enter —
ми виправимo
Андрій Бруснікін про архіви НТКУ: Майже весь радянський телерадіоспадок не оцифрований
НТКУ та ОДТРК мають безцінні архіви аудіовізуальної продукції радянського періоду, але більша їх частина досі зберігається на старих носіях. Касети розсипаються, а старі магнітофони, які можуть їх оцифрувати, виходять із ладу. Єдиний спосіб зберегти архіви — якомога швидше почати їх оцифровувати.
Щоб цими матеріалами, а також новими надходженнями могли користуватися всі мовники, які входитимуть до суспільного, буде створено спільний архів. Завдяки йому матеріали не загубляться при трансформації, їх легко буде знайти і стане можливим швидкий обмін між центром та регіонами. Як працюватиме ця система, «Суспільному мовленню» розповів головний технолог ДТРК «Культура» Андрій Бруснікін.
– Андрію, що являють собою архіви НТКУ й усіх мовників, які мають увійти до НСТУ? Розкажіть про них. У якому вони зараз стані?
– У кожного мовника — свій архів. В НТКУ навіть два архіви — новин і програм. Кожний мовник веде свою електронну картотеку, яка є майже у всіх мовників. На цьому хороші новини закінчуються.
Є стандарти метаданих — опису того, що є у файлі. Однієї назви замало, потрібні, як мінімум, ще якась анотація, ключові слова, теги, тип продукції (що це саме — чи це тільки запис аудіо, чи музика, чи сюжет новин, чи художній фільм). Цих ключових індикаторів у тих архівах, які є, приблизно 20–30, і вони відрізняються один від одного. Є стандарт Європейської мовної спілки, він рекомендаційного характеру, необов’язковий, але якщо полічити всі індикатори, то їх приблизно 200, але не всі вони потрібні. І завдання робочої групи в НТКУ зі створення суспільного мовлення — уніфікувати цей стандарт метаданих для всіх організацій, які будуть створювати НСТУ, щоб ми один раз його затвердили і потім виконували, щоби було легко знаходити цю інформацію. Зараз буває так, що один і той же файл зберігається в трьох примірниках на різних носіях, і знайти його дуже-дуже важко.
Щодо стану. З чотирьох найбільших організацій: НРКУ, «Культура», «НТКУ-Новини» (архів новин) і «НТКУ-Програми» (архів програм), лише у двох створено сервер як такий, тобто таке єдине сховище, в якому є ця оцифрована інформація. Навіть в «НТКУ-Новин» немає цифрового архіву, є електронна картотека, але всі новини зберігаються на бетакамах (касетах).
– А що є повністю оцифрованим?
– Повністю оцифрованих архівів немає взагалі, є ті, що наближаються: де цей архів створено, але це не означає, що там все оцифровано. Приміром, в «НТКУ-Програмах» майже весь радянський спадок неоцифрований. У «Культурі» значно легше, бо їй лише 12 років, там не оцифрована фонотека, десь 30% матеріалу не оцифровані, в усіх інших значно більше. Чому? Бо ті носії, на яких зберігається цей матеріал, не вічні, вони виходять із ладу, приміром, розсипаються касети. По-друге, техніка для оцифровки, тобто відеомагнітофони, змінюється покоління за поколінням, і ті магнітофони, які могли читати касети десятирічної й двадцятирічної давнини, в НТКУ все ще є, але вже поламані, головки зчитування браковані, а ці головки вже не виробляються або виробляються поштучно й дуже дорого коштують. У НСТУ як організації (це один із моментів-переваг) є регіональні телерадіокомпанії, в яких ці магнітофони в хорошому стані. Це один із напрямів співпраці між цими організаціями, є приблизно три телекомпанії, які зберегли комплекси, що можуть оцифрувати інформацію для всіх співорганізаторів НСТУ. Це Львівська ОДТРК, наприклад. Здається, ще Івано-Франківськ, можливо, Харків — треба уточнювати. Їх три з двадцяти семи. Ми ще будемо вирішувати, що легше — чи наш контейнер доставити до них, чи їхній магнітофон до нас. Але ніхто тягати й перетягувати на себе не буде. Тим паче, якщо в них це вже налагоджено і є люди, які вміють працювати з цією технікою. Дуже важливо, щоб були фахівці, які вміють працювати на такій техніці.
Наприклад, у ДТРК «Культура» є фонотека, вона не оцифрована саме через те, що останній магнітофон вийшов із ладу. А в НТКУ цих магнітофонів вісім, і вони простоюють, і, звісно, ми вже домовилися, що вони візьмуть нашу фонотеку й оцифрують. Але ми чекаємо затвердження цих стандартів, щоби потім не перероблювати цю роботу знову, бо воно може зберігатися як файл №1, але що воно таке — ніхто не буде знати.
– А в якому стані ці архіви в ОДТРК? Ви це вивчали?
– Вивчали. Частково оцифровані, так само, тобто сервери у когось є, у когось немає. В середньому, якщо взяти середню обласну телерадіокомпанію, це десь до 5 тисяч фільмів власного виробництва, не враховуючи тих фільмів, які могли прийти за обміном, або радянських, або інших, які зберігаються, але їхній статус невизначений, і не зрозуміло, чи треба їх узагалі зберігати. І по всіх обласних телерадіокомпаніях, звісно, багато дублів. Якщо виготовлялася програма, яка потім розповсюджувалася по всіх обласних телерадіокомпаніях, вона зберігається в усіх ОДТРК, а це зайве місце. Але щоби сказати, що це дубль, треба мати загальну базу даних.
– Яка головна мета архівування?
– Перше — аби нічого в нас не загубилося. Створюється нова організація, треба, щоби в цьому процесі ми нічого не загубили.
Друге — щоби в цьому архіві можна було щось знайти. Добре, коли архіваріус знає, де в нього що знаходиться, але якщо це буде розділено по різних телекомпаніях, а планується сьогодні щось поставити, і хочеться знати, з чого вибирати, треба мати єдину електронну базу даних. Потрібно, щоб матеріали були як на долоні, щоб до них був доступ не тільки в центрі, в НСТУ, а також у всіх регіональних телекомпаніях, у різних категорій користувачів, і в майбутньому навіть у глядачів. Відео, яке юридична служба буде вважати можливим для загального доступу, глядачі зможуть знайти на сайті НСТУ.
Третє завдання — повна оцифровка, тобто все перевести на цифру.
– Що саме зберігається в цих архівах? З яких років, який матеріал?
– В архівах усе зберігається з моменту створення телекомпаній, із радянських часів. Щось уже, звісно, загублено, це окрема історія, треба розбиратися, що саме загублено, але це поодинокі випадки.
Кожна компанія веде свій архів, ці всі оригінальні носії десь зберігаються — в якійсь окремій кімнаті, у спеціально пристосованих приміщеннях зі спеціальним температурним режимом, є відповідальні особи, архівні служби. При цьому не в усіх телерадіокомпаніях створено окремі архівні служби, але є співробітники, які цим опікуються, дирекції програм, окремі співробітники-журналісти. У великих телекомпаніях, де є більше людей, створено окремі архівні служби. І тільки нещодавно матеріали почали оцифровуватися і зберігатися в цифровому вигляді. Але от новини НТКУ оцифровують, але не зберігають у цифровому вигляді, зберігають на касетах. Вони його оцифровують, скидають у монтажку, монтують, роблять на комп’ютері нормальний сюжет, видають його в ефір, але не зберігають в електронному вигляді, знову-таки, записують на касету і зберігають на касеті, бо не створено цього серверу.
– Тобто хтось робить сюжет, бере цей архів, оцифровує його, робить сюжет, і потім знову на касету?
– Знову на касету. І потім, коли їм треба знову цей самий план узяти, вони беруть касету, знову її оцифровують, і якість усе гірша, гірша й гірша, це зрозуміло, що в процесі оцифровки якість губиться. В НТКУ є свій архів, але цей сервер не здатний повністю все вмістити, бо обсяг інформації дуже великий, якщо брати систему всіх держтелерадіо, то це декілька петабайт — декілька тисяч терабайт. В НТКУ створено архів довготривалого зберігання, його обсяг майже 1 петабайт — 900 терабайт, і цей архів планується використовувати як центральний резервний архів усіх телерадіокомпаній. Кожна телерадіокомпанія зможе створити там свій архів. Це не значить, що вона віддасть його повністю, це значить, що тут буде копія. Це дуже добре, що є така можливість — усе це зберігати централізовано.
– Я правильно розумію, що кожен мовник, який увійде в НСТУ, має свій архів і оригінали будуть зберігатися в нього?
– Оригінали будуть зберігатися в нього або будуть передані в ті телекомпанії, які зможуть їх оцифровувати, якщо вони ще не оцифровані; але потім ці оригінали можна буде повернути. Вони зберігатимуться там, де найкращі умови. Якщо телерадіокомпанія орендує приміщення й буде прийнято відповідне рішення, тоді інша компанія буде зберігати, однак моментальний доступ до цього вже оцифрованого архіву буде в кожного через інтернет. Можна буде натиснути, за п’ять секунд воно з’явиться, і ти зможеш із ним працювати.
– Тобто тут у Києві буде створено базу для всіх цифрових електронних версій цього архіву?
– Тут ми тільки затверджуємо стандарт. Бази кожен буде вести на місцях, але їх буде синхронізовано, буде одна копія тут, у центрі, а інші — там, вони всі будуть рівноправні. Це щодо баз описів. Якщо дуже грубо, то це екселівська табличка й нічого страшного, якщо вона буде в кожного. Щодо самих файлів, то в кожній телекомпанії зберігається те, що їхнє, а потім резервна копія йде в Київ. І якщо в регіональній телекомпанії сталася пожежа (не доведи Господь!), повінь тощо, і сервер повністю пропав, у центрі воно залишилося. Так само, якщо в центрі ця будівля зруйнувалася, то в регіонах воно залишається. Це називається розподілений архів високої доступності. Мета — створити розподілений кластер.
– А хто буде власником архівів?
– Юридична особа НСТУ.
– Хто розробляв індикатори?
– Розробляла Європейська спілка мовників, а вже підгрупа №2 робочої групи (технічна група, куди входять технічні директори всіх телерадіокомпаній) роздивилася це, і невдовзі затвердить, бо зараз це все в процесі, скоро всі зможуть ознайомитися, вносити пропозиції і вже потім затвердимо остаточно. На робочій групі ми це вже затвердили.
– Тобто ця система подібна до європейської?
– Так, ми її взяли за взірець. Звісно, в нас є свої локальні особливості, наприклад, прокатне свідоцтво, якого в Європі немає, в них є інше, але це вже нюанси. За взірець взято європейську модель, яка, в свою чергу, є підвидом моделі метаданих загальної Dublin Core Metadata ініціатив — це така організація, що затверджує опис метаданих, але дуже-дуже абстрактний. А вже щоб його адаптувати до збереження відео, Європейська мовна спілка зробила свою робочу групу, ми взяли це за взірець і адаптували.
– Чи є гроші на оцифровування? І хто це буде робити?
– У кого є техніка і бажання цим займатися, той і буде робити.
Спочатку затверджуємо стандарти. Щоб ми це зробили один раз і не переробляли. Якщо ми будемо вносити цю інформацію, а потім хтось скаже: «Ой, а мені треба ще це поле!» — то це вже буде складніше. Тому цей етап першочерговий.
Далі ми заявляємо, що саме хочемо отримати. Відбудеться аукціон, і всі зацікавлені учасники презентують своє бачення, яке відповідає нашому технічному завданню, і ми вже виберемо.
Створення й розбудова локального кластера між НРКУ, НТКУ і ДТРК «Культура», це в цій будівлі, і впровадження локальних систем збереження. Вони вже є — ці локальні системи, але не пов’язані між собою, вони існують відокремлено, і щоби їх зв’язати, треба вирішити дві проблеми: перша — побудова власної мережі, це зараз вирішується, і друга — розширення цих локальних сховищ та відносна їх уніфікація, щоб усі вони працювали, щоб було налагоджено резервування, щоб у неробочий час, вночі, готова продукція за день відсилалася на центральний сервер, який слугуватиме точкою обміну. Хоча буде передбачено можливість, якщо, скажімо, Рівне захоче ту продукцію, що виготовив Житомир, безпосередньо взяти з Житомира без залучення сервера, який розташований у Києві.
Тобто це розподілена географічна система, яка є безсмертною, що великий плюс. Незалежно від того, що сталося в одній області, вся система продовжує працювати.
– Тобто Рівне може взяти через центральний сервер або напряму в Житомира?
– Так. Центральний сервер називається центральним тільки тому, що він розташований у Києві й приєднаний до архіву довготривалого зберігання, однак по всіх інших параметрах вони всі однакові.
– За яким принципом ви будете вносити архіви в базу?
Ось категорії метаданих. Загальні дані: назва, тип, жанр, назва серії, номер серії, сезон, задіяні особи — учасники подій, знімальна група організації та окремо ті, кого згадано в титрах. Згідно з Рекомендацією Європейської мовної спілки, треба заносити в базу даних контакти осіб. Тобто вони заносять мобільні телефони, імейли, щоб можна було через 20 років спробувати зв’язатися. Бо, наприклад, в НТКУ ці запити регулярно надходять: я знімався 30 років тому в хорі, був там «мальчик-зайчик» зліва, прошу, хто там у мене був керівник, чи ще щось. І вони піднімають ці архіви, однак із організованою базою даних це було би значно легше.
Анотації бувають різні, від одного абзацу до повної розкадровки: що там щохвилинно, посекундно, синхрон, субтитри, ключові слова, дата створення, дата зйомки, історія показів на телебаченні, мова (оригінальна або мови дублювання), виробник, примітки. Це загальне, це те, що рекомендовано заповнювати всім.
Технічні дані збираються автоматично. Це формат відео, аудіо, хронометраж, контрольна сума. Ця технічна інформація дуже важлива, але її не треба вносити вручну.
В НРКУ своя специфіка: форма музики, лад музики, особливості виконання, тип концерту, тональність. Звісно, це не для всіх, а якщо ми беремо музичний твір. Якщо це інтерв’ю, то це не обов’язково — хочеш заповнюй, хочеш — ні.
Службові дані, унікальні ідентифікатори, версія змін, хто коли що змінив у цій базі даних.
Юридичні дані — це окреме питання. Туди входить прокатне посвідчення, власник авторського права, список авторів, термін дії ліцензії, дати закінчення прав на показ, претензії, нотаріальний номер, вікові обмеження, рекомендації щодо перегляду, примітки з авторських прав. Це супроводжує юридичний відділ, не технічний, не редактори. Тобто для кожної категорії користувачів є різні інтерфейси програми, щоби їм було легше працювати.
Додаткові метадані — це для аналітиків — кількість запитів, переглядів тощо.
– Скільки це буде коштувати?
– Ми рахували для першого кластера, було заявлено десь 50 тисяч доларів, але він буде трохи більший, ніж саме для архіву, він слугуватиме ще для виробництва новин.
– Розкажіть, будь ласка, про інтерфейс. І про те, кому будуть доступні архіви.
– Інтерфейс — окремо для занесення інформації, окремо для пошуку, окремо для аналітики. Архівна служба, програмна служба, рекламна служба — кожен вноситиме щось своє, те, за що вони відповідають.
Юридична служба буде вносити статуси щодо ліцензій, прокатного свідоцтва тощо. Редакції вносять інформацію про те, хто там знімався, й таке інше. Пошук передбачається для редакцій, архівної служби, відділу технічного контролю, журналістів, інших співробітників і в майбутньому для глядачів.
І аналітика. Для керівництва, для маркетологів, архівної служби, технічної служби. Що значить аналітика для архівної служби? Їм можна виводити дані щодо ступенів наповненості між різними компаніями, щоб вони подивилися, перевірили, чи все відповідає стандарту. Окрім того, є можливість ставити запити мовою програмування SQL, це можуть бути складні запити, які дозволяють вивести на екран такі дані з бази, як час, графік, зміни, частки комедії з 1990 по 1995 роки. Це для тих, хто цим займається. Вони можуть ввести свої коди, програми, і воно їм усе виведе.
– А як виглядатиме інтерфейс для глядачів?
– Для глядачів за взірець візьміть Netflix або українські fs.to та ex.ua. Їм не треба, наприклад, знати, коли матеріал виходив в ефір НТКУ. Мабуть, не треба. А якщо буде ця потреба, то це виводиться дуже легко. Для них будуть доступні 20–30 полів, які є в цих базах.
– І юристи будуть визначати, що можна в загальний доступ, а що ні?
– Так. Це окреме питання — оцінка, цим займаються відповідні юридичні підрозділи, окрема група, не технічна. Ми лише надаємо інтерфейс.
– Деякі представники ОДТРК і НТКУ висловлювали побоювання, що архіви можуть розікрасти в процесі трансформації на суспільного мовника…
– Це перше наше завдання — щоб нічого не загубити. Тобто ми залишаємо все в областях, у регіонах, вони отримують можливість скачати будь-яку продукцію інших регіонів, а ми дублюємо в архів довготривалого зберігання, щоб нічого не загубити. Бо були випадки, коли зі зміною керівництва обласної телерадіокомпанії архів губився. Давно, десять років тому, але були такі випадки. Тому ми повинні все зберегти.
– Які фахівці будуть це все оцифровувати?
– Технічні фахівці. А далі працюватимуть редактори, вони можуть це переглядати, прослуховувати, нотувати. Залежить від того, що ми оцифровуємо — чи це сюжет новин, чи художній фільм, чи шум або вибух гармати, чи якийсь пейзаж. Для кожної категорії своя робота.
Виготовляється продукція в редакції, то їм, звісно, легше, бо це сам режисер і він надає свою інформацію редактору, він краще за всіх знає, що в нього в цьому фільмі. А якщо це старий матеріал, то ним займається архівна служба, залучаючи відповідну редакцію, це може бути музична редакція, редакція дитячих програм. Тобто людина може подивитися і сказати: о, це знаний актор такий-то. Архіваріуси це все знають, але чогось можуть не знати, тому залучають тих людей, які компетентні саме в цій сфері. Вони можуть не отримувати цього поштою, а попросити, і вже редакція в своєму інтерфейсі вносить безпосередньо в цей файл потрібну інформацію, не треба буде туди-сюди його пересилати.
Так само юристи. Архівна служба не буде звертатися листом із підписом до юридичної з проханням надати якусь інформацію. Юридична служба в своєму інтерфейсі бачить ті файли, які ще потребують їхньої роботи, і зразу в цьому інтерфейсі заповнює, що потрібно. Ми відходимо від паперового обміну, все електронне й прозоре. Керівництво бачить, хто вніс які зміни, і так само бачать аналітики й архівна служба, видно, хто відстає від графіка, в кого які проблеми на якому етапі. Ми максимально автоматизуємо це, надаємо інструмент для кожної категорії користувачів.