Давным давно висит в багзилле запрос на добавление в Calc функции "Удалить дубликаты". В MS Excel это делается нажатием одной кнопки, в Calc - путём не очень очевидных операций со стандартным фильтром.
В принципе существовало расширение, которое (вроде как) делало эту работу. Однако, как оказалось, на огромных количествах строк это расширение входило в ступор из-за весьма не оптимального алгоритма обработки строк.
В процессе конференции LibOCon 2019 Майк на это дело решил поглядеть и поглядел. А когда летел домой в самолете, ещё пошаманил. Я чуть изменил диалог, добавил прогрессбар, чтобы было видно, что расширение вообще работает, а не тупо зависло.
В итоге, мы получили расширение, которое за 40 сек обрабатывает 1 милион строк.
Я его пока выложил тут вот, на форуме в первом посте.
Расширение доступно на официальном сайте https://extensions.libreoffice.org/extensions/remove-duplicates-fast.
Расширение доступно на официальном сайте https://extensions.libreoffice.org/extensions/remove-duplicates-fast.
Комментариев нет:
Отправить комментарий
Внимание! Сообщения проходят премодерацию!