Маленькие "радости" Microsoft Word Как известно, документы, для которых сколько-нибудь важнО оформление, люди обычно готовят в редакторе Microsoft Word, являющимся стандартом (увы!) почти повсеместно. Однако почему-то до сих пор мало кто знает, что Word при записи DOC-файла добавляет в него не только много килобайт мусора (в виде одних и тех же повторяющихся данных и пустого пространства), но ещё и информацию об авторе, что в определённых ситуациях позволяет достоверно вычислить источник того или иного письма с точностью до компьютера. Всё это можно легко узнать, вызвав нажатием правой клавиши мыши в "проводнике" свойства DOC-файла и выбрав вкладки "Сводка" и "Статистика" (может не работать при "кривой" установке Office). Даты и время создания/изменения здесь также берутся из тела файла, а _не_ из его атрибутов (то есть, они жёстко прописываются в DOC-файле!) Узнать можно ещё больше, если открыть DOC-файл в шестнадцатеричном редакторе типа HIEW. Например, путь к документу и вложенным в него файлам на компьютере его автора, название организации, на которую зарегистрирована эта копия Office и даже тип принтера (2 последних пункта - только если документ был создан в Word 95), установленного на компьютере, где документ готовился, даже если он на нём не печатался. А по типу принтера можно судить и о доходах потратившейся на него организации... Что ещё интереснее, если DOC-файл был впоследствии открыт и сохранён где-то на другом компьютере, он собирает в себя и его данные. Если учесть, что в Word'е есть функция автосохранения, по умолчанию срабатывающая через 10 минут после открытия файла, это, вероятно тоже можно как-то использовать... Ещё раз напомню: Word 97 (во всяком случае, моя копия - с SR-2 и ещё каким-то Security patch) собирает меньше данных, чем Word 95. Более того, в HIEW из них удастся разобрать лишь те, что были введены по-английски, да и то с трудом - Word 97 пишет их в Unicode. Для просмотра может быть использована, например, такая программа, как FAR (www.rarsoft.com - очень рекомендую, хотя Unicode viewer при такой записи, какую делает Word, иногда может показать не всё: если между двухбайтными символами Unicode окажется нечётное число байт, текст, идущий после этого, FAR, понятно, распознает неправильно). Однако для определения автора письма бывает вполне достаточно и того, что есть, то бишь, данных, выводимых в окне свойств файла. *** Чтобы "убить" отображение вышеуказанных данных на вкладке свойств файла, в теле DOC-файла символ, идущий после последовательности байт D5 CD D5 9C в конце файла, заменяют на 00 с помощью hex-редактора; перед этим имеет смысл на всякий случай сделать резервную копию. Текстовые строки, идентифицирующие автора текста и заметные при 16-ричном просмотре, также заменяются на последовательности "нулей". *** Самая же большая гадость (или радость - кому как) состоит в том, что всё это относится не только к DOC-файлам, но и к тем, что имеют структуру RTF! При этом, если вызвать их свойства в проводнике, никаких дополнительных вкладок там показано не будет, что создаст иллюзию защищённости. Просмотрите RTF-файл, подготовленный в Word, с помощью HIEW, и вы обнаружите, что в нём есть секция {\info ...}, которая содержит практически те же самые данные, что Word пишет в DOC-файлы. Кроме того, там довольно много мусора (постоянные вставки {\lang ...} в тексте, переполнена секция {\colortbl ...} и т.д.) *** Кроме того, в DOC-файле в ряде случаев (при каких обстоятельствах - я уже детально не выяснял, но это имеет место, причём часто) указывается путь к нему и вставленным в него файлам на компьютере автора этого документа. С учётом того, что в разных языковых версиях Windows папка "Мои документы" называется по-разному, и по умолчанию Word сохраняет документы именно там, это обстоятельство позволяет с определённой степенью достоверности определить, где был написан документ. *** Вдобавок к вышеописанным, существует ещё проблема GUID - идентификаторов, которые Word шифрует и также помещает в документы без спроса пользователя. Впоследствии с их помощью можно легко определить копию MS Office, в которой был набран документ. Существует ряд программ, позволяющих удалять эти идентификаторы. Однако гарантировать полную надёжность работы этих утилит, сами понимаете, не представляется возможным. С другой стороны, обо всём этом всерьёз говорят лишь разработчики указанных утилит; я обнаружил, что хотя GUID и существуют, они не шифруются (просто пишутся в виде Unicode). Более того, для разных документов они совершенно различны. *** Выше речь шла только о MS Word 95 и 97 и DOC-файлах, однако я замечал подобные данные и при просмотре файлов других форматов (XLS, например), подготовленных программами из пакета MS Office. В MS Office 2000 проблема устранена не была. Впрочем, что прискорбно, проблема "шпионства" присуща многим популярным программам, и не только производства Microsoft. - Павел Кармышев.