Проект 'ПОтребитель'
Главная | Новости | Информация | Статьи | Программы
Законы | Ссылки | О проекте | Off topic


Информация - Microsoft Office


1. О проблеме идентификаторов GUID - записываемых во все документы Office элементов, в которые якобы помещается информация о пользователе и его компьютере - стало известно уже достаточно давно, в прошлом году. Как следует из ряда заявлений, GUID уникальны для каждой копии Office и потому могут быть использованы для идентификации автора по имеющемуся документу. Достоверно известно, что GUID помещаются в документы WinWord 97 и Excel 97, аналогичная информация существует и о базах данных Access 97.

Для удаления GUID из документов независимыми разработчиками реализован ряд программ. О них можно узнать (и скачать архивы), например, здесь:

Guideon фирмы Vector Development
GuidClean фирмы General Frenetics

Справедливости ради следует сказать, что в подготовленных мною на одном и том же PC документах WinWord 97 GUID оказались разными (использовался WinWord 97 SR-2 с Security patch от Microsoft), поэтому вероятность того, что именно в них реально хранятся какие-то закодированные данные, по-моему невысока.

Тем не менее, вне зависимости от того, насколько правдивы высказывания разработчиков указанного ПО относительно специфичности GUID для каждого компьютера, факт остаётся фактом - продукция Microsoft помещает эту информацию в документы без санкции пользователей, и, соответственно, незаконно.

2. Вторая проблема WinWord куда более серьёзна, чем первая, хотя говорят о ней реально гораздо меньше. Здесь речь действительно идёт о том, что Word при записи DOC-файла добавляет в него не только много килобайт мусора и пустого пространства, но ещё и информацию об авторе, что в определённых ситуациях позволяет достоверно вычислить источник того или иного документа с точностью до компьютера.

Эти данные можно увидеть, вызвав нажатием правой клавиши мыши в "проводнике" свойства DOC-файла и выбрав вкладки "Сводка" и "Статистика" (может не работать при "кривой" установке Office). Даты и время создания/изменения здесь также берутся из тела файла, а не из его атрибутов (то есть, они жёстко прописываются в DOC'е!)

Узнать можно ещё больше, если открыть DOC-файл в шестнадцатеричном редакторе типа HIEW. Например, путь к документу и вложенным в него файлам на компьютере его автора, название организации, на которую зарегистрирована эта копия Office и даже тип принтера (2 последних пункта - только если документ был создан в Word 95), установленного на компьютере, где документ готовился, даже если он на нём не печатался. А по типу принтера можно судить и о доходах потратившейся на него организации...

Причём, заверения MS о контролируемости записи этих данных соответствующей опцией - полная чушь. Информация об авторе документа прописывается в том числе и в нередактируемом из Word'а информационном поле.

Что ещё интереснее, если DOC-файл был впоследствии открыт и сохранён где-то на другом компьютере, он собирает в себя и его данные. Если учесть, что в Word'е есть функция автосохранения, по умолчанию срабатывающая через 10 минут после открытия файла, это, вероятно, тоже небезопасно...

Ещё раз отмечу: Word 97 (во всяком случае, моя копия - с SR-2 и ещё каким-то Security patch) собирает в документы меньше данных, чем Word 95. Более того, в HIEW из них удастся разобрать лишь те, что были введены по-английски, да и то с трудом - Word 97 пишет их в Unicode. Для просмотра может быть использована, например, такая программа, как FAR (www.rarsoft.com - очень рекомендую, хотя Unicode viewer при такой записи, какую делает Word, иногда может показать не всё: если между двухбайтными символами Unicode окажется нечётное число байт, текст, идущий после этого, FAR, понятно, распознает неправильно). Однако для определения автора письма бывает вполне достаточно и того, что есть, то бишь, данных, выводимых в окне свойств файла.

Самая же большая гадость (или радость - кому как) состоит в том, что всё это относится не только к DOC-файлам, но и к тем, что имеют структуру RTF! При этом, если вызвать их свойства в проводнике, никаких дополнительных вкладок там показано не будет, что создаст иллюзию защищённости. Просмотрите RTF-файл, подготовленный в Word, с помощью HIEW, и вы обнаружите, что в нём есть не только очень много мусора (постоянные вставки {\lang ...} в тексте, переполнена секция {\colortbl ...} - по этим признакам можно однозначно установить, что RTF писался именно в Word'е), но и секция {\info ...}, которая содержит практически те же самые данные, что Word пишет в DOC-файлы.

Естественно, утилиты вроде Guideon (я использовал версию 1.10) оставляют всю эту информацию в целости и сохранности, как в DOC-файлах, так и, тем более, в RTF.

Не проверял, происходит ли что-то подобное с XLS- и PPT-файлами, поскольку программами Excel и PowerPoint не пользуюсь за их ненадобностью мне. Наверное, всё-таки происходит. В чём я уверен, так это в том, что в Office 2000 всё это дело осталось без изменений. Мораль же сей басни такова: важные письма писать надо в чистом тексте. Если всё-таки надо использовать оформление, отдаём предпочтение RTF, после чего уничтожаем с помощью редактора, поддерживающего строки длиной под 300 символов (такой есть в FAR - при условии достаточного количества RAM), секцию от

---> {\info

и по

{\vern#}} <--- (# - число, которое для разных копий WinWord различно).

Что касается DOC, то их "оперируют" обычно в HIEW - чтобы "убить" отображение вышеуказанных данных на вкладке свойств файла, в теле документа символ, идущий после последовательности байт D5 CD D5 9C в конце файла, заменяют на 00; перед этим имеет смысл на всякий случай сделать резервную копию. Текстовые строки, идентифицирующие автора текста и заметные при 16-ричном просмотре, также заменяются на последовательности "нулей". Но всё это, согласитесь, очень неудобно и полного результата не гарантирует.

В DOC-файлах есть и ряд других интересных полей; я подозреваю, что там, в частности, записывается 20-значный серийный номер Office в зашифрованной форме. Однако в России опасность быть вычисленным только по нему, думаю, невелика, потому что у нас все ставят Office с одинаковых пиратских дисков и регистрируют одинаковыми серийными номерами ;-)



Наверх Письмо Web-мастеру