Текстовый редактор для открытия больших (гигантских, огромных, больших) текстовых файлов

Под *nix или Cygwin, просто используйте less. (Есть известная поговорка - "меньше - значит больше, больше или меньше" - потому что "меньше" заменила более раннюю команду Unix "больше", с добавлением возможности прокрутки вверх). Поиск и навигация в less очень похожи на Vim, но здесь нет файла подкачки и используется мало оперативной памяти.

Существует Win32-порт GNU less. См. раздел "less" в ответе выше.

Perl

Perl хорош для быстрого написания сценариев, а его оператор ... (переключение диапазона) служит хорошим механизмом выбора, ограничивающим количество мусора, через который вам придется пробираться.

Например:

$ perl -n -e 'print if ( 1000000 .. 2000000)' humongo.txt | less

Это извлечет все от строки 1 миллион до строки 2 миллион, и позволит вам просеять вывод вручную в less.

Другой пример:

$ perl -n -e 'print if ( /regex one/ .. /regex two/)' humongo.txt | less

Это начинает печатать, когда "регулярное выражение один" находит что-то, и останавливается, когда "регулярное выражение два" находит конец интересного блока. Может быть найдено несколько блоков. Просеять вывод...

logparser

Это еще один полезный инструмент, который вы можете использовать. Цитируя статью в Википедии:

logparser - это гибкая утилита командной строки, которая изначально была написана Габриэле Джузеппини, сотрудником Microsoft, для автоматизации тестов для регистрации IIS. Она предназначалась для использования в операционной системе Windows и была включена в комплект инструментов IIS 6.0 Resource Kit. По умолчанию logparser работает как "конвейер обработки данных", принимая SQL-выражение из командной строки и выводя строки, содержащие совпадения с SQL-выражением.

Microsoft описывает Logparser как мощный, универсальный инструмент, обеспечивающий универсальный доступ к текстовым данным, таким как файлы журналов, XML и CSV, а также к ключевым источникам данных в операционной системе Windows, таким как журнал событий, реестр, файловая система и Active Directory. Результаты входного запроса могут быть отформатированы в текстовом виде или сохранены в более специальных целях, таких как SQL, SYSLOG или диаграмма.

Пример использования:

C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line > 1000 and line < 2000"
C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line like '%pattern%'"

Относительность размеров

100 МБ - это не слишком много. 3 ГБ - это уже многовато. Я работал в типографии, которая создавала около 2% почтовых отправлений первого класса в США. На одну из систем, для которой я был техническим руководителем, приходилось около 15+% почтовых отправлений. У нас было несколько больших файлов, которые нужно было отлаживать то тут, то там.

И еще...

Не стесняйтесь добавлять сюда другие инструменты и информацию. Этот ответ - вики сообщества не просто так! Нам всем нужно больше советов по работе с большими объемами данных...

MultiplyByZer0

Редактировал ответ 3-го ноября 2018 в 11:04

Cygwin - Wikipedia

en.wikipedia.org

less(1): opposite of more - Linux man page

Less is a program similar to more (1), but which allows backward movement in the file as well as forward movement. Also, less does not have to read the ...

linux.die.net

logparser - Wikipedia

en.wikipedia.org

185

0

Похожие сообщества 5

Microsoft Stack Jobs

2 353 пользователей

Work & freelance only Microsoft Stack. Feed https://t.me/Microsoftstackjobsfeed Чат про F#: @Fsharp_chat Чат про C#: @CSharpChat Чат про Xamarin: @xamarin_russia Чат общения:@dotnettalks

Открыть telegram

Pro Windows

1 588 пользователей

Microsoft Windows и всё, что с этим связано. Правила: https://t.me/pro_windows/308448 Список интересных групп и каналов: https://github.com/goq/telegram-list

Открыть telegram

pro_winapi

674 пользователей

Обсуждение вопросов программирования в OS Windows на C/C++ и других языках, связанных с API этой операционной системы

Открыть telegram

Инсайдеры Windows 18+

605 пользователей

Чат блога outsidethebox.ms и канала @sterkin_ru: Windows, Microsoft, Google, мобильный мир, игори, гаджеты и вело Помощь с проблемами → @winsiders_support Здесь нет: - политики, хамства и троллей - нарушений УК РФ и священного EULA - вашей рекламы

Открыть telegram

Сообщество разработчиков на Universal Windows Platform

211 пользователей

Вам могут быть интересны: @csharpchat, @dotnetchat, @dotnettalks

Открыть telegram

Добавить вопрос

Категории

Все

Технологий

Культура / Отдых

Жизнь / Искусство

Наука

Профессии

Бизнес

Пользователи

1

Зарегистрирован 2 недели назад

2

Артур «Апер»

Зарегистрирован 1 месяц назад

3

Viktor Malyutin

Зарегистрирован 2 месяца назад

4

Viktor Malyutin

Зарегистрирован 2 месяца назад

5

Syahputra Zhedenk

Зарегистрирован 2 месяца назад

Хотите что-то узнать? Задавайте Ваш вопрос на нашем сайте

ru.kzen.dev

Nick Ryberg · Accepted Answer · 2008-10-01T20:25:19+00:00

VS Code (Windows, macOS, Linux) - Бесплатная программа с открытым исходным кодом и красивым графическим интерфейсом. Редактируется файл JSON размером 3,6 ГБ, загружается за минуту. У вас должно быть достаточно оперативной памяти для загрузки файлов.

Бесплатные средства просмотра только для чтения:

glogg (Windows, macOS, Linux) - Подтверждено, что может работать с файлами размером несколько ГБ. Главная особенность - поиск по регулярным выражениям. Имеет вкладки, читает файлы непосредственно с диска, может наблюдать/следовать за файлами и позволяет пользователю отмечать строки.
LogExpert (Windows) - "GUI-замена для tail." Поддерживает следование за файлами, поиск, фильтрацию, настраиваемое выделение, плагины и внешние инструменты.
Large Text File Viewer (Windows) - Минималистична и имеет очень маленький размер исполняемого файла. Поддерживает разделенный вид, настройку текстовой темы, поиск с помощью regex и следование за файлом.
Lister (Windows) - еще более маленькая и минималистичная. Это один исполняемый файл, едва ли 500 КБ, но он все еще поддерживает поиск (с регексами), печать, режим шестнадцатеричного редактора и настройки.

Бесплатные редакторы:

Vim и Emacs (Windows, macOS, Linux) - классические редакторы Unix. Непростые в освоении, но очень эффективные. В них есть настройки, которые можно изменить, чтобы сделать их еще быстрее.
Large File Editor (Windows) - открывает и редактирует файлы TB+, поддерживает Юникод, использует мало памяти, имеет функции, специфичные для XML, и включает двоичный режим.
HxD (Windows) - шестнадцатеричный редактор, не текстовый, но удивительно быстрый и полезный.
GigaEdit (Windows) - Поддерживает поиск, статистику символов и настройку шрифтов. Но он глючит - при работе с большими файлами он позволяет только перезаписывать символы, но не вставлять их; он не считает LF терминатором строки, только CRLF; и он'медленный.

Встроенные программы (установка не требуется):

less (macOS, Linux) - Традиционный инструмент пейджера командной строки Unix. Позволяет просматривать текстовые файлы практически любого размера. Может быть установлен и в Windows.
Notepad (Windows) - Прилично работает с большими файлами, особенно с отключенной оберткой слов.
MORE (Windows) - Имеется в виду Windows MORE, а не Unix more. Консольная программа, позволяющая просматривать файл по одному экрану за раз.

Веб-просмотрщики:

htmlpen.com - Может открывать и синтаксически подсвечивать файлы TB+. Позволяет редактировать, за исключением очень больших файлов. Поддерживает поиск, регексы и экспорт.
readfileonline.com - Еще один HTML5-просмотрщик больших файлов. Поддерживает поиск.

Платные редакторы:

010 Editor (Windows, macOS, Linux) - Открывает гигантские (до 50 ГБ) файлы.
SlickEdit (Windows, macOS, Linux) - Открывает большие файлы.
UltraEdit (Windows, macOS, Linux) - Открывает файлы размером более 6 ГБ, но для этого необходимо изменить конфигурацию: Menu » Advanced » Configuration » File Handling » Temporary Files » Open file without temp file...
EmEditor (Windows) - отлично справляется с очень большими текстовыми файлами (официально до 248 Гб, но по одним данным до 900 Гб).

И, наконец, пробовали ли вы открыть большой файл в обычном редакторе? Некоторые редакторы действительно могут работать с достаточно большими файлами. В частности, Notepad++ (Windows) и Sublime Text (Windows, macOS, Linux) поддерживают файлы размером 2 ГБ.