Как убрать дубликаты в гугл таблицах: Очистка данных в Google Таблицах

Содержание

как выделить и удалить дубликаты

При работе в Google Таблицах вы можете столкнуться с большими таблицами, в которых вам придется иметь дело с множеством повторяющихся записей. Мы понимаем, как мучительно работать с дубликатами и как сложно выделять и удалять записи одну за другой. Однако с помощью условного форматирования выделение и удаление дубликатов становится довольно простым делом. Следуя этому руководству, мы расскажем, как найти и удалить повторяющиеся записи в Google Таблицах.

резюме

Прежде чем мы узнаем, как удалить повторяющиеся записи из Google Таблиц, давайте узнаем, как выделить дубликаты в одном столбце. Следуй этим шагам.

  1. Откройте свою электронную таблицу в Google Таблицах и выберите столбец.
  2. Например, выберите колонна > Формат > Условное форматирование.
  3. В разделе Правила форматирования откройте раскрывающийся список и выберите Персонализированная формула.
  4. Введите значение настраиваемой формулы, = counttif (A1: A, A1)> 1.
  5. В разделе «Правила форматирования» вы найдете стили форматирования, которые позволяют вам установить другой цвет для выделенных дубликатов. Для этого нажмите кнопку Цвет заливки и выберите свой любимый оттенок.
  6. Когда вы закончите, коснитесь Готовые чтобы выделить дубликаты в одном столбце.
  7. Аналогичным образом, если вам нужно сделать это для столбца C, формула будет иметь следующий вид: = counttif (C1: C, C1)> 1 и вы делаете то же самое для других столбцов.

Кроме того, есть способ найти дубликаты в середине столбцов. Чтобы узнать, выполните следующие действия.

  1. Предположим, вы хотите выделить дубликаты между ячейками с C5 по C14.
  2. В этом случае перейдите к Формат и выберите Условное форматирование.
  3. В разделе Применить к диапазону введите диапазон данных, С5: С14.
  4. Затем в разделе «Правила форматирования» откройте раскрывающийся список и выберите Персонализированная формула.
  5. Введите значение настраиваемой формулы, = counttif (C5: C, C5)> 1.
  6. Установите другой цвет для выделенных дубликатов, выполнив предыдущие шаги, если хотите. Когда вы закончите, коснитесь Готовые.
  7. Установите другой цвет для выделенных дубликатов, выполнив предыдущие шаги, если хотите. Когда вы закончите, коснитесь Готовые.

Таблицы Google: как выделить дубликаты в нескольких столбцах

На всякий случай, если вы хотите выделить дубликаты в нескольких столбцах и строках, выполните следующие действия.

  1. Откройте свою электронную таблицу в Google Таблицах и выберите несколько столбцов.
  2. Например, выберите столбцы от B до E> щелкните Формат > щелкните Условное форматирование.
  3. В разделе Правила форматирования откройте раскрывающийся список и выберите Персонализированная формула.
  4. Введите значение настраиваемой формулы, = counttif (B1: E, B1)> 1.
  5. Установите другой цвет для выделенных дубликатов, выполнив предыдущие шаги, если хотите. Когда вы закончите, коснитесь Готовые.
  6. Аналогичным образом, если вы хотите выбрать дубликаты для столбцов с M по P, вы замените B1 на M1 и E на P. Новая формула станет, = counttif (M1: P, M1)> 1.
  7. Кроме того, если вы хотите выделить дубликаты для всех столбцов от A до Z, просто повторите предыдущие шаги и введите значение настраиваемой формулы, = counttif (A1: Z, A1)> 1.

Google Таблицы: удаление дубликатов из электронной таблицы

После того, как вы выделили повторяющиеся записи на листе, следующим шагом будет их удаление. Следуй этим шагам.

  1. Выберите столбец, в котором вы хотите удалить дубликаты.
  2. Cliquez-сюр- Les données > Удалить дубликаты.
  3. Вы увидите всплывающее окно. проверка поле рядом с данными теперь имеет заголовок> щелкните Удалить дубликаты > щелкните Готовые.
  4. Вы также можете повторить шаги для других столбцов.

Вот как вы можете выделять и удалять дубликаты в Google Таблицах.

Для получения дополнительных руководств посетите наш раздел «Как сделать».


IPhone 12 mini и HomePod mini — идеальные устройства Apple для Индии? Мы обсуждали это в Orbital, нашем еженедельном техническом подкасте, на который вы можете подписаться через Apple Podcasts, Google Podcasts или RSS, загрузить эпизод или просто нажать кнопку воспроизведения ниже.

Чтобы быть в курсе последних технических новостей и обзоров, следите за Gadgets 360 на Twitter, Facebook и Новости Google. Чтобы смотреть самые свежие видео о гаджетах и ​​технологиях, подпишитесь на наш канал на YouTube.

Как найти и удалить дубликаты в Google Sheets – GmodZ.ru

Если вы являетесь постоянным пользователем Google Таблиц, у вас, вероятно, столкнулись с проблемой, когда вы случайно добавили повторяющиеся записи в свою электронную таблицу. Эта ситуация может разрушить набор данных, над созданием которого вы так усердно работали. Вы можете не знать, что это произошло, особенно когда ваш компьютер выходит из строя или когда вы нажимаете трекпад на своем ноутбуке.

В любом случае, слишком легко что-то упустить, когда в вашей таблице огромное количество данных. Типичные результаты включают ошибки вычислений и повторяющиеся ячейки, которые трудно определить при поиске источника проблемы.

К счастью, существует несколько различных методов выделения дубликатов в ваших электронных таблицах.

  • Используйте встроенную функцию удаления дубликатов.
  • Используйте выделение для поиска дубликатов.
  • Копируйте уникальные ячейки и перемещайте их на новый лист.
  • Используйте сторонний инструмент для поиска дубликатов.
  • Создайте сводную таблицу, которая подсчитывает дубликаты на индивидуальной основе.

Вышеуказанные процессы упрощают поиск повторяющихся записей, поэтому что вы можете удалить их или игнорировать, если они совпадают, но не являются дубликатами. Вот ваши варианты.

Используйте Google Sheets’ Функция удаления дубликатов

Независимо от того, пытаетесь ли вы найти дубликаты в одном столбце, двух столбцах или на всем листе, функция «Удалить дубликаты» точно удаляет ячейки с одинаковыми данными. Однако учтите, что он удаляет все дубликаты, даже если они не связаны с одними и теми же данными.

  1. Выделите столбцы, которые хотите проверить. для дублирования данных.
  2. В меню вверху выберите Данные, а затем выберите Удалить дубликаты.

  3. Появится всплывающее диалоговое окно. Установите флажки рядом с каждым столбцом в списке, который вы хотите проверить, или вы можете поставить галочку напротив Выбрать все, , а затем нажать Удалить дубликаты.

  4. Google Таблицы показывают, сколько копий было найдено и удалено, чтобы вы могли убедиться, что процесс работает должным образом.

Использование Google Таблиц’ встроенная функция “Найти и удалить дубликаты” Функция — это самый простой способ устранить дубликаты, но иногда вам может понадобиться просмотреть копии перед их удалением. Отличный способ сделать это — выделить цветом.

Выделить дубликаты с помощью цвета для быстрого удаления

Когда дело доходит до выявления ошибок в ваших электронных таблицах, использование выделения, чтобы выделить любую неверную информацию, является еще одним хорошим способом.

  1. Откройте файл Google Sheets и выберите столбец или столбцы. вы хотите отсортировать.

  2. В в строке меню вверху выберите Формат.
  3. В раскрывающемся меню выберите Условное форматирование.
  4. Выберите диапазон в появившемся новом меню.

  5. В разделе Правила форматирования измените раскрывающийся список на Формат ячеек если… в Пользовательская формула:.

  6. Вставьте следующую формулу в поле, расположенное под параметром Пользовательская формула:

    =countif(A:A,A1)>1.

  7. В разделе Стиль форматирования выберите значок цвета заливкичтобы выделить содержимое желтым (или любым другим цветом по вашему выбору) фоном ячейки.

  8. Нажмите Готово, чтобы сохранить изменения.

Ваша электронная таблица теперь будет выделять повторяющиеся ячейки выбранным вами цветом, и вы можете просмотреть выборку на наличие дубликатов.

Примечание.Лучше всего выделять ячейки столбца, начиная с первой строки, а не выбирать ячейки в середине. Формула не любит использовать строку 2 в качестве первого столбца. В выбранном поле (A2:B9) пропущено несколько дубликатов. После добавления строки 1 (A1:B9) были обнаружены все дубликаты. См. два изображения ниже.

Изображение №1: показаны пропущенные дубликаты при выборе ячеек строки 2 в качестве первых ячеек (A2 и B2):

Изображение №2: показаны все дубликаты при выборе ячеек строки 1 в качестве первых ячеек (A1 и B1):

Убедитесь, что все существующие дубликаты верны, поскольку некоторые копии вообще не являются копиями. Это может быть один и тот же номер для двух разных учетных записей, пользователей, сотрудников или чего-то еще. Как только вы подтвердите, что ячейки подражателя вам не нужны, удалите их. Наконец, вы можете закрыть меню форматирования и восстановить стандартный цвет ячеек.

Копировать уникальные ячейки в Google Sheets для простого удаления дубликатов

Если вы предпочитаете автоматически сортировать необработанные данные, лучше скопировать все уникальные ячейки, а не дублировать их. Этот процесс обеспечивает более быструю сортировку и фильтрацию. Если вы уверены, что ваша информация верна, и предпочитаете вместо этого удалить дубликаты, попробуйте способ, описанный ниже.

  1. Откройте документ Sheets, который вы хотите отсортировать, и выделите столбец, который хотите изменить. Этот процесс запишет диапазон столбцов для следующего шага.

  2. Выделив столбец, щелкните пустой столбец, в котором должны отображаться уникальные записи. . Вставьте следующую формулу в поле ввода формулы в верхней части документа: =UNIQUE()

  3. Введите координаты ячейки исходного столбца в скобках, например: (A3:A9).

  4. Нажмите Ввод, чтобы переместить новые данные в столбец, который вы указанный ранее.

После этого вы можете либо проверяйте записи вручную или импортируйте данные в рабочую таблицу.

Используйте стороннее дополнение для поиска и удаления дубликатов в таблицах

Существуют онлайн-плагины, доступные для использования с Google Sheets. Вы найдете надстройки в Google Workspace Marketplace, включая инструменты для автоматического удаления повторяющихся записей.

Удалить дубликаты с помощью Ablebits

Подходящий инструмент, известный как Удаление дубликатов с помощью Ablebits, позволяет вам для быстрого поиска дубликатов во всем листе информации или путем поиска до двух столбцов одновременно.

р>Вы можете перемещать, удалять и выделять результаты. Инструмент включает две настройки мастера: найти и удалить дубликаты и найти уникальные ячейки или качества в вашем документе. Эти два параметра упрощают отслеживание информации по мере ее поступления.

В целом, использование инструмента-мастера для поиска информации может быть оправдано в долгосрочной перспективе. Это утверждение в первую очередь предназначено для пользователей, которые постоянно ищут дубликаты в своих электронных таблицах и предпочитают тратить свое время на что-то другое.

Используйте сводную таблицу для поиска повторяющихся строк в таблицах

Сводная таблица — это удобный инструмент для более детального изучения данных. Сводная таблица не удаляет повторяющиеся ячейки или строки автоматически; он показывает, какие столбцы имеют дубликаты, чтобы вы могли вручную просмотреть свои данные и посмотреть, что нужно удалить, если что-то нужно.

Создание сводной таблицы немного сложнее, чем другие методы, показанные в этой статье. Вы должны добавить сводную таблицу для каждого столбца, чтобы обеспечить единообразие результатов и точное выявление дубликатов.

Примечание.Если в электронной таблице нет названий столбцов, сводные таблицы не будут работать точно для поиска дубликатов. Попробуйте временно добавить новую строку, а затем назовите столбцы, используя эту новую строку.

Вот как использовать сводную таблицу для выявления повторяющихся ячеек или строк.

  1. Выберите все данные таблицы, затем перейдите в раздел Данные > Сводная таблица.

  2. При необходимости измените диапазон ячеек, затем нажмите Создать.

  3. Выберите Добавить рядом с Строки. На этом шаге будет выбран столбец для поиска дубликатов. Да, вы правильно прочитали. Выберите нужный столбец в раскрывающемся меню. Если вы потеряли редактор сводной таблицы, нажмите на заполненную ячейку, чтобы вернуть его.

  4. Теперь выберите Добавить рядом с Значения и выберите тот же столбец, что и выше, но установите для него суммирование по COUNT или COUNTA. Он уже должен быть установлен по умолчанию.

  5. Новая сводная таблица будет выявлять дубликаты, как показано ниже.

  6. Если вы хотите просмотреть другой столбец, вы можете повторить описанные выше шаги (чтобы сохранить предыдущие результаты) или снова открыть редактор сводной таблицы, а затем изменить существующую таблицу.

  7. Сводная таблица изменится, чтобы показать новые настройки.

Как упоминалось ранее, метод сводной таблицы немного сложнее. Тем не менее, он дает вам отчет о повторяющихся записях’ места, которые могут быть очень полезны для анализа данных. Дополнительную информацию об использовании сводных таблиц см. в руководстве TechJunkie по созданию, редактированию и обновлению сводных таблиц в Google Таблицах.

Подведение итогов

В целом, повторяющаяся ячейка в Google Sheets может вызвать проблемы с вашими данными, если вы не будете осторожны, особенно при попытке отсортировать финансовую информацию в полезную электронную таблицу.

Наиболее распространенные причины дублирования:

  • Несколько человек добавили одного и того же клиента, счет, категорию, товар и т. д.
  • Импорт данных добавлены к уже существующим данным во второй раз.
  • Действия копирования/вставки добавили повторяющиеся записи.

К счастью, идентификация, удаление и удаление идентичных ячеек данных на удивление просты в Google Sheets, что хорошо, если вы постоянно имеете дело с электронными таблицами в своем повседневном рабочем процессе. Если вы ищете что-то, чтобы лучше сортировать свой контент, вы всегда можете использовать надстройку, такую ​​​​как Remove Duplicates от Ablebits, чтобы ваша информация была хорошо отсортирована и хорошо организована.

Есть ли у вас опыт, советы или вопросы по использованию любого из методов, упомянутых в этой статье? Дайте нам знать в разделе комментариев ниже.

4 способа удаления дубликатов в Google Sheets

Автор
Николь Макдональд

Узнайте, как использовать несколько методов для удаления дубликатов из ваших таблиц Google и сэкономить время.

Как и везде в вашей жизни, ваш Google Sheet может быть немного грязным и время от времени нуждаться в хорошей уборке дома. Одной из самых неприятных проблем может быть дублирование информации в нескольких местах вашей электронной таблицы.

Вот несколько простых методов, которые вы можете использовать, чтобы найти и удалить повторяющиеся данные в вашей таблице Google.

1. Удаление дубликатов с помощью инструмента «Удалить дубликаты»

Инструмент Удалить дубликаты — это самый надежный и практичный метод удаления дубликатов в Google Таблицах, и с него следует начинать в первую очередь. В качестве примера мы использовали короткий список контактов, который часто является худшим виновником дублирования данных.

Выполните следующие действия, чтобы удалить дубликаты с листа с помощью инструмента «Удалить дубликаты»:

  1. Откройте свой Google Sheet .
  2. Выберите область на листе, из которой вы хотите удалить дубликаты. Вы можете быстро сделать это, щелкнув и перетащив мышь из верхней левой ячейки в нижнюю правую ячейку вашего списка, выделив все ячейки, которые вы хотите сканировать в процессе удаления дубликатов.
  3. Выберите Данные в строке меню.
  4. Выберите Удалить дубликаты из параметров меню.
  5. Вам будет предложено выбрать, какие столбцы вы хотите проверить на наличие дубликатов. Вы можете удалить дубликаты там, где строки полностью совпадают, или выбрать конкретный столбец, например адрес или имя, независимо от того, какие данные находятся в других столбцах.
  6. Выбрать Удалить дубликаты . Затем вам будет представлен сводный отчет о том, сколько дубликатов было удалено.

2. Удаление дубликатов с помощью формул

Существует несколько способов использования формул в Google Sheets, которые помогут вам идентифицировать и удалить повторяющиеся данные, некоторые из которых сложнее, чем другие. Вот самые простые способы использования формул для удаления дубликатов.

Использование УНИКАЛЬНОЙ Формулы

Этот метод удаляет дубликаты в выбранном диапазоне данных. Он сравнивает каждую строку данных и удаляет все повторяющиеся строки. Его очень легко реализовать, так как он включает в себя одну формулу с одним аргументом — диапазоном, из которого вы хотите удалить дубликаты.

Используйте формулу UNIQUE, выполнив следующие действия:

  1. Откройте свой Google Sheet .
  2. Выберите пустую ячейку.
  3. Введите эту формулу = UNIQUE (A2: D9) , указав ячейки, которые вы хотите выбрать.
  4. Нажмите Введите на клавиатуре или щелкните мышью. Теперь у вас будет вторая таблица с удаленными дубликатами.

Использование формулы СЧЁТЕСЛИ

Этот метод сначала выделяет дубликаты в вашем наборе данных. Когда значение отображается впервые, счетчик будет равен 1, поэтому результат формулы будет ложным. Но когда значение появится во второй раз, счет будет равен 2, поэтому результат формулы будет ИСТИНА.

Преимущество этой формулы в том, что она позволяет просмотреть дубликаты перед удалением.

Выполните следующие действия, чтобы использовать формулу СЧЁТЕСЛИ для удаления дубликатов с листа:

  1. Откройте свой Google Sheet .
  2. Создайте новый столбец рядом со столбцом данных, который вы хотите проверить на наличие дубликатов, используя Вставить левый , найденный под Вставить в меню.
  3. Введите =СЧЁТЕСЛИ(диапазон, критерии)>1 в верхнюю ячейку нового столбца, который вы создали, чтобы выделить дубликаты. В нашем примере формула для проверки повторяющихся фамилий будет =СЧЁТЕСЛИ(B$2:B2,B2)>1 . Вы заметите, что диапазон равен B$2:B2 , знак $ блокирует диапазон до текущей строки, даже если вы копируете формулу вниз по столбцу C. Таким образом, эта формула будет проверять наличие дубликатов в текущей строке назад. до вершины для вас.

3. Удаление дубликатов с помощью сводных таблиц

Сводные таблицы

могут быть чрезвычайно полезны для поиска дубликатов в вашей таблице Google. Он чрезвычайно гибкий и быстрый в использовании, поэтому часто с него удобно начинать, если вы не уверены, есть ли дубликаты в ваших данных.

Выполните следующие действия, чтобы определить и удалить дубликаты из таблицы:

  1. Откройте свой Google Sheet .
  2. Выделите свой набор данных.
  3. В меню Данные выберите Сводная таблица .
  4. Выберите, хотите ли вы создать эту новую таблицу в Новый лист или Существующий лист . Редактор сводных таблиц откроется справа от вашего листа.
  5. Выберите Ряды и выберите Столбец , который вы хотите проверить на наличие дубликатов (например, фамилия).
  6. Выберите ЗНАЧЕНИЯ , выберите тот же столбец, что и выбранный выше, и убедитесь, что он настроен на суммирование с помощью COUNT или COUNTA .

Теперь вы можете легко найти эти повторяющиеся значения на исходном листе и решить, что делать дальше. Как видите, этот метод идеально подходит, когда вы проверяете дубликаты и хотите изучить их подробнее.

Связано: Как создавать сводные таблицы в Google Sheets

4. Удаление дубликатов с условным форматированием

Этот метод состоит из двух шагов: первый выделяет ваши дубликаты, а второй удаляет выделенные дубликаты, что позволяет вам увидеть свой дубликат перед удалением.

Чтобы применить условное форматирование для удаления дубликатов с листа, выполните следующие действия:

  1. Откройте свой Google Sheet .
  2. Выберите данные, из которых вы хотите удалить дубликаты.
  3. до 9 лет0017 Формат выберите Условное форматирование для боковой панели.
  4. В разделе Формат ячеек, если выберите Пользовательская формула .
  5. Введите следующую формулу: =СЧЁТЕСЛИ($B$2:$B2,B2)>1 . Эта формула проверяет наличие дубликатов в выбранном столбце.
  6. Установите стиль форматирования , чтобы выделить повторяющиеся данные.
  7. Если вы хотите, чтобы ваши результаты выделяли всю строку, вы можете изменить формулу на =СЧЁТЕСЛИ($B$2:$B2,$B2)>1 .
  8. Удаление дубликатов необязательно, но теперь это легко сделать. Выделите данные, которые вы хотите отсортировать, и выберите пункт меню Filter .
  9. Выберите значок фильтра рядом с заголовком столбца, который вы хотите отсортировать по цвету.
  10. В раскрывающемся меню выберите Сортировать по цвету , затем Цвет заливки и выберите цвет заливки, который должен отображаться сверху.
  11. Выделите блок дубликатов и нажмите Удалить .

Связано: Как профессионально сортировать столбцы в Google Таблицах

Существуют и другие способы удаления дубликатов в Google Таблицах, в том числе использование скрипта Google Apps и приобретение надстройки в Google Workspace Marketplace. Их стоит проверить, если вы не получаете желаемых результатов.

Использование скрипта приложений дает вам возможность легко запускать скрипт в любое время. Также доступны дополнительные приложения для регулярной проверки дубликатов.

Получите четкое представление о ваших данных

Эти методы избавят вашу электронную таблицу от дубликатов, дадут вам четкое представление о ваших данных и сэкономят ваше время. Надеемся, что знание этих быстрых и простых способов удаления дубликатов сделает вашу жизнь немного более организованной.

Компания Google постоянно совершенствует свое программное обеспечение, поэтому следите за последними обновлениями.

7 простых способов найти и удалить дубликаты в Google Sheets

Ищете простой способ найти дубликаты в Google Sheets? Как насчет 7 способов? 🙂 Это все, что вам нужно для многочисленных вариантов использования 🙂 Я покажу вам, как использовать инструменты без формул (без программирования — обещаю!), условное форматирование и несколько простых функций для заядлых поклонников формул.

Независимо от того, как часто вы используете Google Таблицы, скорее всего, вам придется иметь дело с повторяющимися данными. Такие записи могут располагаться в одном столбце или занимать целые строки.

К концу этой статьи вы будете знать все, что нужно для удаления дубликатов, их подсчета, выделения и идентификации со статусом. Я покажу несколько примеров формул и поделюсь различными инструментами. Один из них даже находит и удаляет дубликаты в ваших таблицах Google по расписанию! Условное форматирование также пригодится.

Просто выбери свой яд и вперед 🙂

Как найти дубликаты в Google Таблицах с помощью формул

Традиционно начну с формул. Их главное преимущество в том, что ваша исходная таблица остается нетронутой. Формулы идентифицируют дубликаты и возвращают результат в другое место в ваших таблицах Google. И в зависимости от желаемого результата различные функции делают свое дело.

Как удалить дубликаты в Google Sheets с помощью функции UNIQUE

Функция UNIQUE сканирует ваши данные, удаляет дубликаты и возвращает именно то, что говорит ее название — уникальные значения/строки.

Вот небольшой пример таблицы, в которой повторяются разные строки:

Пример 1. Удалите повторяющиеся строки, сохраните первые вхождения

С одной стороны, вам может понадобиться удалить все повторяющиеся строки из этой таблицы Google Sheets и оставить только первые записи.

Для этого просто введите диапазон ваших данных внутри UNIQUE:

=UNIQUE(A1:C10)

Эта небольшая формула возвращает все уникальные строки и все 1-е вхождения, игнорируя 2-е, 3-е и т. д.

Пример 2. Удалить все повторяющиеся строки, даже первые вхождения

С другой стороны, вы можете захотеть получить только «настоящие» уникальные строки. Под «настоящими» я подразумеваю те, которые не повторяются — ни разу. Ну так что ты делаешь?

Давайте на минутку просмотрим все UNIQUE аргументы:

UNIQUE(range,[by_column],[exactly_once])

  • range — это данные, которые вы хотите обработать.
  • [by_column] — сообщает, проверяете ли вы полностью совпадающие строки или ячейки в отдельных столбцах. Если это столбцы, введите TRUE. Если это строки, введите FALSE или просто пропустите аргумент.
  • [exactly_once] — указывает функции удалять не только дубликаты в Google Sheets, но и их первые записи. Или, другими словами, возвращать только записи без каких-либо дубликатов. Для этого вы ставите TRUE, иначе FALSE или пропускаете аргумент.

Этот последний аргумент является вашим рычагом здесь.

Следовательно, чтобы полностью удалить все повторяющиеся строки из ваших таблиц Google (вместе с их 1-м), пропустите второй аргумент в формуле, но добавьте третий:

=УНИКАЛЬНЫЙ(A1:C10,ИСТИНА)

Видите, таблица справа намного короче? Это потому, что UNIQUE нашел и удалил повторяющиеся строки, а также их первые вхождения из исходной таблицы Google Sheets. Теперь остаются только уникальные строки.

Выявление дубликатов с помощью функции СЧЁТЕСЛИ Google Таблиц

Если использование места с другим набором данных не является частью вашего плана, вместо этого вы можете подсчитать дубликаты в Google Таблицах (а затем удалить их вручную). Это займет всего один дополнительный столбец, и функция СЧЁТЕСЛИ поможет.

Совет. Если вы не знакомы с этой функцией, у нас есть целая запись в блоге о ней, не стесняйтесь взглянуть.

Пример 1. Получение общего количества вхождений

Давайте отождествим все дубликаты с их 1-м вхождением в Google Таблицах и проверим общее количество каждой ягоды, появляющейся в списке. Я буду использовать следующую формулу в D2, а затем скопирую ее вниз по столбцу:

=СЧЁТЕСЛИ($B$2:$B$10,$B2)

Совет. Чтобы эта формула автоматически обрабатывала каждую строку в столбце, оберните все в ArrayFormula и измените $B2 $B2:$B10 (весь столбец). Таким образом, вам не нужно будет копировать формулу вниз:

Если впоследствии вы отфильтруете этот набор данных по номерам, вы сможете увидеть и даже удалить все лишние повторяющиеся строки из вашей таблицы Google Sheets вручную:

Пример 2. Найдите и перечислите все дубликаты в Google Sheets

. Если общее количество вхождений не является вашей целью, и вы предпочитаете знать, является ли эта конкретная запись в этой конкретной строке 1-й, 2-й и т. д., вам понадобится внести небольшую корректировку в формулу.

Измените диапазон со всего столбца ($B$2:$B$10) на одну ячейку ($B$2:$B2) .

Примечание. Обратите внимание на использование абсолютных ссылок.

=СЧЁТЕСЛИ($B$2:$B2,$B2)

На этот раз удалить любые или все дубликаты из этой таблицы Google Sheets будет ещё проще, потому что вы сможете скрыть все записи, кроме первой. one:

Пример 3. Подсчет повторяющихся строк в Google Sheets

Хотя приведенные выше формулы подсчитывают дубликаты только в одном столбце Google Sheets, вам может понадобиться формула, которая учитывает все столбцы и, таким образом, идентифицирует повторяющиеся строки.

В этом случае лучше использовать СЧЁТЕСЛИМН. Просто перечислите каждый столбец таблицы вместе с соответствующими критериями:

=СЧЁТЕСЛИМН($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$ C2)

Совет. Есть и другой способ вычисления дубликатов — без формул. Он включает в себя сводную таблицу, и я опишу ее далее.

Отметить дубликаты в колонке статуса — функция ЕСЛИ

Иногда цифр недостаточно. Иногда лучше найти дубликаты и отметить их в столбце статуса. Опять же: фильтрация ваших данных Google Sheets по этому столбцу позже позволит вам удалить те дубликаты, которые вам больше не нужны.

Пример 1. Поиск дубликатов в 1 столбце Google Sheets

Для этой задачи вам понадобится та же функция СЧЁТЕСЛИ, но на этот раз с функцией ЕСЛИ. Вот так:

=ЕСЛИ(СЧЕТЕСЛИ($B$2:$B$10,$B2)>1,"Дубликат","Уникальный")

Посмотрим, что получится в этой формуле:

  1. Сначала , COUNTIF ищет во всем столбце B ягоду из B2. После того, как найдено, он суммирует их.
  2. Затем ЕСЛИ проверяет эту сумму и, если она больше 1, говорит Дубликат , иначе Уникальный .

Конечно, вы можете получить формулу для возврата ваших собственных статусов или, например, найти и идентифицировать только дубликаты в ваших данных Google Sheets:

=ЕСЛИ(СЧЁТЕСЛИ($B$2:$B$10,$B2 )>1,"Дубликат","")

Совет. Как только вы найдете эти дубликаты, вы сможете отфильтровать таблицу по столбцу статуса. Таким образом, вы можете скрыть повторяющиеся или уникальные записи и даже выбрать целые строки и полностью удалить эти дубликаты из ваших Google Таблиц:

Пример 2. Идентификация повторяющихся строк

Аналогичным образом можно пометить абсолютно повторяющиеся строки — строки, в которых все записи во всех столбцах встречаются в таблице несколько раз: столбец для его первого значения и считает только те строки, где все 3 записи во всех 3 столбцах повторяются:

=СЧЁТЕСЛИМН($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)

  • Затем заключите эту формулу в IF. Он проверяет количество повторяющихся строк, и если оно превышает 1, формула называет строку дубликатом:

    =ЕСЛИ(СЧЕТЧИСЛО($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)>1,"Дубликат","")

  • Теперь есть только 2 повтора, потому что, несмотря на то, что Cherry встречается в таблице 3 раза, только у двух из них все 3 столбца идентичны.

    Пример 3. Найти повторяющиеся строки, игнорировать 1-е вхождение

    Чтобы игнорировать 1-е вхождение и отметить только 2-е и остальные, обращаться к первым ячейкам таблицы, а не ко всем столбцам:

    = ЕСЛИ (СЧЁТЕСЛИМН($A$2:$A2,$A2,$B$2:$B2,$B2,$C$2:$C2,$C2)>1,"Дубликат","")

    Совет. Если вы используете Microsoft Excel, могут быть полезны следующие примеры: Как найти дубликаты в Excel.

    Идентификация и выделение дубликатов в Google Таблицах с помощью правил условного форматирования

    Есть возможность обрабатывать повторяющиеся данные таким образом, что один взгляд на вашу таблицу даст вам четкое представление о том, является ли это дублирующей записью.

    Я говорю о выделении дубликатов в Google Таблицах. В этом вам поможет условное форматирование.

    Совет. Никогда не пробовали условное форматирование? Не беспокойтесь, мы объяснили, как это работает в этой статье.

    Вот что вам нужно сделать:

    1. Открыть настройки условного форматирования: Формат > Условное форматирование .
    2. Убедитесь, что поле Применить к диапазону содержит диапазон, в котором вы хотите выделить дубликаты. В этом примере позвольте мне начать со столбца B.
    3. В правилах формата выберите Пользовательская формула и введите тот же СЧЁТЕСЛИ, который я представил выше:

      =СЧЁТЕСЛИ($B$2:$B$10,$B2)>1

    Как только он обнаружит записи, которые встречаются в столбце B хотя бы дважды, они будут окрашены в выбранный вами оттенок:

    Другой вариант — выделить повторяющиеся строки. Просто настройте диапазон, к которому будет применяться правило:

    Совет. Как только вы выделите дубликаты в своих таблицах Google, вы можете отфильтровать данные по цвету:

    • С одной стороны, вы можете отфильтровать столбец так, чтобы оставались видимыми только ячейки с белым цветом заливки. Таким образом вы удалите дубликаты из вида:
    • С другой стороны, вы можете оставить видимыми только цветные ячейки:

    , а затем выберите эти строки и полностью удалите эти дубликаты из ваших Google Таблиц:

    Способы поиска и удаления дубликатов в Google Таблицах без формул

    Формулы и условное форматирование хороши, но есть и другие инструменты, которые вам помогут найти дубликаты. Два из них были разработаны именно для этой задачи.

    Выявление дубликатов с помощью сводной таблицы для Google Таблиц

    Сводная таблица используется в электронных таблицах для изменения данных и облегчения чтения и понимания таблиц. Это своего рода альтернативный способ представления ваших наборов данных.

    Самое привлекательное здесь то, что исходные данные не меняются. Сводная таблица использует его как справку и предоставляет результат на отдельной вкладке.

    Этот результат, кстати, будет динамически меняться в зависимости от настроек, которые вы можете настроить на ходу.

    В случае повторяющихся записей сводная таблица поможет вам подсчитать и удалить дубликаты в Google Таблицах.

    Пример 1. Как сводная таблица считает дубликаты в Google Sheets
    1. Перейдите Вставка > Сводная таблица , укажите диапазон данных и место для сводной таблицы:
    2. В редакторе сводной таблицы добавьте столбец с вашими дубликатами ( Name в моем примере) для строк и для значений .

      Если ваш столбец содержит числовые записи, выберите COUNT в качестве итоговой функции для Значения для подсчета дубликатов в Google Таблицах. Если у вас есть текст, вместо этого выберите СЧЕТЧИК:

    3. .

    Если вы все сделаете правильно, сводная таблица покажет каждый элемент из вашего списка и даст вам количество раз, которое он там появляется:

    Как видите, эта сводная таблица показывает, что в моих данных повторяются только ежевика и вишня. установлен.

    Пример 2. Удаление дубликатов в Google Sheets с помощью сводной таблицы

    Чтобы удалить дубликаты с помощью сводной таблицы, вам нужно добавить остальные столбцы (2 в моем примере) как Строки для вашей сводной таблицы:

    Вы увидите таблицу с повторяющимися строками, но числа покажут, какие из них повторяются в исходном наборе данных:

    Подсказка. Если вам больше не нужны числа, просто закройте поле Values ​​ в сводной таблице, нажав соответствующую иконку в правом верхнем углу:

    Вот как в итоге будет выглядеть ваша сводная таблица:

    Нет дубликаты, никаких дополнительных вычислений. Есть просто уникальные записи, отсортированные в одной таблице.

    Удаление дубликатов — стандартный инструмент для очистки данных

    В Google Sheets есть небольшой, простой и непритязательный инструмент для удаления дубликатов. Он называется после его операции и находится на вкладке Данные > Очистка данных :

    Здесь вы не найдете ничего необычного, все очень просто. Вы просто указываете, есть ли в вашей таблице строка заголовка, и выбираете все те столбцы, которые должны быть проверены на наличие дубликатов:

    Когда вы будете готовы, нажмите большую зеленую кнопку, и инструмент найдет и удалит повторяющиеся строки из ваших Google Таблиц. table и сказать, сколько уникальных строк осталось:

    Увы, это все, на что способен этот инструмент. Каждый раз, когда вам нужно будет иметь дело с дубликатами, вам придется запускать эту утилиту вручную. Кроме того, это все, что он делает: удаляет дубликаты. Нет возможности обрабатывать их по-другому.

    К счастью, все эти недостатки были устранены в надстройке Remove Duplicates для Google Sheets от Ablebits.

    Надстройка «Удалить дубликаты» для Google Таблиц

    Надстройка «Удалить дубликаты» меняет правила игры. Начнем с того, что он содержит 5 различных инструментов для выявления дубликатов в Google Таблицах. Но сегодня давайте посмотрим на Найти повторяющиеся или уникальные строки .

    Только он предлагает 7 различных способов обработки дубликатов и не только ускоряет весь процесс. Он знает, как это полностью автоматизировать.

    После того, как вы установите его из Google Workspace Marketplace, он появится в разделе Extensions :

    Как стандартный инструмент Google Sheets, он также позволяет вам выбирать диапазон и столбцы для обработки, но более элегантно 🙂

    Все настройки разделены на 4 удобных шага, где вы должны выбрать:

    1. диапазон
    2. что найти: дубликаты или уникумы
    3. столбцы
    4. что делать с найденными записями

    Можно даже посмотреть специальные картинки, чтобы всегда было понятно, что делать:

    Какой смысл, подумаете вы? Что ж, в отличие от стандартного инструмента, это дополнение предлагает гораздо больше:

    • поиск дубликатов , а также уникальных, включая или исключая первые вхождения
    • выделить дубликатов в Google Sheets
    • добавить столбец состояния
    • копировать/перемещать результаты на новый лист/электронную таблицу или в любое другое место в вашей электронной таблице
    • очистить найдено значения из ячеек
    • полностью удалить повторяющиеся строки из вашего Google Sheet

    Просто выберите способ, который вам больше всего подходит, выберите параметры и позвольте надстройке сделать свою работу.

    This entry was posted in Популярное