Транскрибирование будет частично автоматизировано

Вот сижу разрабатываю новый интерфейс управления процессом транскрибирования. Уже просто не справляюсь с объемом писем на почту. Хочу немного автоматизировать процесс выдачи заданий и контроль их выполнения.
Потому что, к сожалению, бывают ситуации, когда кто-нибудь берет лекцию для перевода в текст и пропадает надолго или даже насовсем, а я не могу отследить этот момент в почте. И только спустя, бывает, пол года я замечаю, что какую-нибудь лекцию так и не прислали.

Завтра нужно передать эскизы интерфейса программистам, динамлю Петю уже несколько дней, потому что сижу рисую и параллельно публикую лекции… Но скоро все будет проще и быстрее! Шутка ли ежедневно по 5 лекций переводится в текст и публикуется. Прямо «всем миром всем народом»! =)

Низкий поклон всем тем, кто бескорыстно помогает нам в этом трудном деле!

Перевод лекций в текст

Этот процесс идет без остановки уже два года. Началось всё с того, что я решил добавить к аудиолекциям тексты. Тексты хорошо индексируются поисковиками, а это значит, что люди будут приходить не только по рекомендации друзей а и прямо из поисковых машин Яндекса и Гугла. С текстом можно удобно работать выделяя интересные вещи, делая цитаты и так далее.

Сначала я попробовал переводить лекции в текст самостоятельно. Но даже с моей закалкой производительность 1 лекция в неделю при серьезной занятости это вообще ничего. Это всего 52 лекции в год. Так проект развивать было нельзя.

Я обратился в разные конторы, которые предлагали услуги по расшифровке записей. Получил приблизительную картину в рублях. Выходило за одну лекцию на 100 минут нужно заплатить 3500р. И если я хотел делать по 30 лекций в месяц, нужно было приготовить 105.000 р. Таких денег у меня не было. Но я не остановился и искал дальше. Я нашел исполнителей в два, три, четыре раза дешевле…

Как подсказывал закон рынка: «есть спрос — есть и предложение». Я решил прикинуть, сколько я могу реально платить за перевод аудио в текст и озвучить эту сумму на free-lance.ru. Это была оплата 4 рубля за минуту записи. Конечно 8 из 10 фрилансеров к которым я обратился послали меня сразу. Но некоторые заинтересовались и взялись пробовать.

Так это началось летом 2010 года с небольшой команды из нескольких человек, которую вскоре возглавила Анастасия Климчук. Спасибо ей огромное, за то что она забрала часть коммуникаций на себя. Так появилась команда стенографистов www.zapisal.com которая без перерывов и выходных работает над текстами, для портала Аудиоведа.

С течением времени собралась и другая команда. Команда добровольцев которые взялись помогать бесплатно, просто за идею. Идею бесплатного распространения знания для всех умеющих слушать и читать.

Сегодня в процессе перевода лекций в текст задействовано в целом более сорока человек. Каждый день у меня на почте появляется от четырех до десяти новых текстов лекций, которые нужно преобразовать в формат сайта и проверить хотя бы бегло на ошибки. Сказать, что работы стало больше — значит ничего не сказать =)

Роман Михайлов

Бесконечное транскрибирование …

Мало того, что zapisal.com выдает как пулемёт тексты лекций для audioveda.ru, так ведь есть еще помимо этого человек 10 добровольцев, которые (да продлит Аллах их дни) присылают материалы вовремя и настолько регулярно, что порою я с трудно скрываемой черной завистью думаю о тех счастливчиках, у которых есть секретарша.  Зато сегодня опубликованы еще семь лекций Шридхара Махараджа!

  1. «Чаяния наших сердец устремлены к Красоте» 21 июня 1983 года
  2. «Даже ограниченная вера может связать нас с Безграничным»27 июня 1983
  3. «Центростремительный поток» 8 Июля 1983
  4. «Вспомогательные средства на пути преданности» 18 Июля 1983
  5. «Апракрита – сверхсубъективный мир» 19 Июля 1983
  6. «Игра чудесного Абсолюта» 25 Июля 1983
  7. «Душа есть частица мира сознания» 28 Июля 1983

Понятное дело что это  Hi-Level content и не каждое сознание готово к такому разрушительному воздействию. Но зато это то к чему в принципе должен придти, каждый идущий по пути бхакти йоги, если он, конечно, не шутит, а всерьез собирается на поиски Абсолютной истины…

Разделение труда

Как я уже писал насчет публикаций присылаемых транскриптов для audioveda.ru — процесс это очень муторный и состоит из последовательных операций в различных программах. Сегодня вечером, когда настал черед забросить 10 новых текстов на сайт, Бхувана Сундари предложила мне свою помощь. Мы распределили задачи так, что я преобразовывал тексты в HTML, публиковал и делал записи в борт журнал, а она делала посты в блок об успешном добавлении нового материала. На удивление мы сделали 10 лекций достаточно быстро. Буквально за час с небольшим. Конвеер это все-таки сила!

Список свежих текстов для сайта audioveda, опубликованных в последний момент можно всегда видеть на сайте команды стенографистов zapisal.com.

200 тысяч на перевод в текст

На сегодняшний день мы потратили на перевод материалов в текст 200.786 р. При этом, примерно половина денег была собрана пожертвованиями посетителей сайта. Спасибо вам больше, друзья!  Команда стенографистов «zapisal.com» за прошедший месяц перевела 110 часов аудио и новые материалы в текстовом виде появляются каждый день.

Zapisal.com ставит рекорды!

За прошедший январь месяц с помощью команды стенографистов www.zapisal.com было переведено в текст 110 с половиной часов аудиолекций. Это реально много. Это столько, что я работаю уже на пределе, каждый день преобразуя текст в HTML и проверяя материал. По три, четыре, пять лекций в день! И с одной стороны хочется немного притормозить, с другой стороны когда еще будет такой драйв? Аудиоведа становится круче и круче. На сегодня аудиоведа это самый большой архив ведических лекций.

Я просто мечтаю о том дне, когда у меня появится помощник по обработке текстового материала. К сожалению на помощь преданных рассчитывать не приходится. Они сегодня готовы помогать, а завтра уже их и след простыл. Поэтому, как в случае с zapisal.com придется обращаться к наемным силам, безотказно совершающим агьята-сукрити.

Нужны редакторы

Если пол года назад я получал на почту в среднем один-два транскрипта и мог себе позволить заниматься ими два раза в неделю, то сейчас ситуация такова, что мне нужно уделять этому процессу внимание каждые два дня, а лучше вообще каждый день, чтобы не копилось. Потому что сегодня я преобразовал в HTML и залил на сайт 13 текстов. На это ушло 3 с половиной часа. То есть это почти половина обычного рабочего дня.

Объем готового текстового материала нуждающегося в тщательной проверке и корректировке давно перевалил за сотню. В свете последних тенденций (у меня больше нет полноценного помощника) этот объем увеличивается катострофически быстро.

Проект осуществляющий  транскрибирование аудио — Zapisal.com крепко встал на ноги и выдает тексты лекции со скоростью до 200 минут обработанного звука в день. Это просто нереально быстрые темпы образования контента. И с одной стороны меня это все очень радует, но с другой растет процент непроверенного, необработанного текста. Что плохо сказывается на качестве материалов audioveda.ru.

Публикация транскриптов проходит ночью, когда никто не мешает…

Лег спать в 8 вечера и уже в половине первого ночи бодрый проснулся и сел работать. Добавил 8 транскриптов на сайт audioveda.ru. Про каждый написал на zapisal.com. Понял что как-то много действий приходится совершать с одним текстом. И проблема в том, что никак не могу выработать последовательность чтобы меньше одно и тоже повторять и копировать. Но даже при минимальном повторении и оптимизации процесса выходит вот такая последовательность действий…

  1. Нужно открыть в Thunderbird письмо, открыть аттач, скопировать текст.
  2. Открыть текстовый редактор Edit+ и вставить текст туда чтобы преобразовать в HTML.  (Преобразовать именно там потому, что редактор быстрый легкий и умеет работать с регулярными выражениями. Макросы не помогают, потому что часто всякие уникальные случаи. Поэтому несколько поисков с заменой и небольшая ручная корректировка. )
  3. Потом открыть  Google Chrome найти на сайте audioveda.ru эту лекцию и скопировать название лекции в буфер обмена. Открыть еще одну вкладку, зайти на блог на zapisal.com и создать там запись с названием этой лекции, чтобы потом написать пост о том, что лекция преобразована в текст. Пока оставить как есть.
  4. Открыть Dreamweaver открыть лекцию того же автора и сохранить с новым названием вставив его из буфера обмена.
  5. Вернуться в Edit + скопировать полученный HTML в буфер обмена, вставить в Dreamweaver, снова скопировать с дополнительными кусками HTML в буфер обмена.
  6. Открыть удаленный редактор баз данных MySQL-Front, найти там в таблице аудио запись с нужным идентификатором и вставить в поле transcription HTML скопированный из Dreamweaver`a…
  7. Переключиться на Chrome, обновить во вкладке с лекцией страницу и убедиться, что текст нормально встал на место. Запомнить длительность в минутах и и скопировать URL страницы с лекций в буфер обмена. Затем переключиться на вкладку zapisal.com где добавить в заголовок количество минут и закончить написание поста про то, что готов новый текст. При этом не забыть вставить в текст поста ссылку на лекцию, чтобы она вела на audioveda.ru.
  8. Количество минут в уме перевести в стоимость в рублях и сделать проплату через webmoney или Яндекс деньги исполнителю, если тот нуждается в оплате.
  9. Затем открыть Excel и в общем графике транскрибирования сделать пометку что такая-то лекция такого-то числа была прислана, первично проверена и оплачена.
  10. Вернуться в Thunderbird и отписать человеку , который выполнит транскрипт, что все хорошо, текст получен и размещен, передан на проверку, деньги высланы и поблагодарить его за помощь в этом нелегком деле…

Открыть следующее письмо и повторить все с начала…

150 тысяч на транскрипты

Сегодня перешагнули еще одну полу-круглую цифру. С момента начала «тотальной транскрибации» потратили 150 тысяч рублей на перевод аудио-лекций в текстовый формат. И приблизительно треть денег была пожертвована посетителями сайта! Я теперь на 100% убежден, что не надо ничего продавать и впаривать. Нужно просто делать хорошие удобные вещи для людей. Ибо люди на самом деле вполне отзывчивые и вменяемые и всегда готовы профинансировать хорошее дело, кто чем может. Вот уже третий год сайт развивается естественным путем безо всякой рекламы и находит поддержку у своей аудитории. Так что еще раз хочу сказать всем спасибо!

Оценим силы…

В рамках начатого летом 2010 года тотального транскрибирования (расшифровки записей) аудиолекций www.audioveda.ru мне стало интересно: какой объем материалов мы можем обработать в месяц. Говоря мы, я подразумеваю – Я и все те замечательные ребята, которые так или иначе причастны к проекту zapisal.com. Для измерения я решил воспользоваться штатным блогом установленным на домене. Я буду каждый день публиковать отчет о проделанной работе и по итогам марта месяца посчитаем, какое количество часов мы можем выдавать в тексте. Я думаю, что речь идет о 40-50 часах. Ну это так… мой субъективный прогноз. Увидим… Это не ахти как много, но зато стабильно и уверенно.