3.1.2.3. Основные правила при составлении CSV вручную

3.1.2.3 Основные правила при составлении CSV вручную

CSV файл открытых данных может быть создан с помощью различных текстовых редакторов:

- "МойОфис Текст"

- Встроенного текстового редактора "блокнот" в Windows или его аналогов в других операционных системах

- Свободно распространяемого текстового редактора с открытым исходным кодом "Notepad++"

- Иных текстовых редакторов

Также файл набора может быть создан сначала в табличном редакторе (в виде электронной таблицы), а после экспортирован уже в CSV. Для этого можно использовать следующие программные продукты:

- "МойОфис Таблицы"

- Р7-Офис

- Microsoft Excel

- OpenOffice Calc

- Иные табличные редакторы

При таком варианте необходимы дополнительные настройки при экспорте в части кодировки и разделителя.

В независимости от способа создания, для получения корректного файла формата csv необходимо соблюдать все нижеперечисленные правила:

1. Все строки должны содержать одинаковое количество полей

Поскольку формат файла предполагает его последующие табличное представление, каждая строка в документе олицетворяет собой строку таблицы.

Нарушение требования приведет к невозможности дальнейшего использования данных. Структурированность файла будет нарушена и по нему будет невозможно построить таблицу.

2. Последнее поле документа не должно завершаться запятой

В ином случае структурированность файла также может быть нарушена, так как будет ожидаться еще одна строка.

3. Ограничения по объему отсутствуют

Файл формата может содержать сколь угодно много записей, а каждое поле файла может содержать сколько угодно символов, включая пробелы.

4. Файл должен быть в кодировке UTF-8

Правильная кодировка обеспечивает корректное отображение всех символов. Неверная кодировка файла может привести к отображению вместо текстовых данных символов "неизвестного языка".

Кодировку файла может быть указана в программном продукте, который используется при создании файла.

Если файл уже создан, но его кодировка отлична от UTF-8, то ее необходимо изменить с помощью любого доступного текстового редактора, который обладает соответствующими функциями.

5. Файл должен соответствовать стандарту Separated Values (CSV) Files"

Подробнее со стандартом можно ознакомиться по ссылке (http://tools.ietf.org/html/rfc4180)