Цитата:
Сообщение от lor2
при таких объемах не боишься что ша начнет коллизии давать например? сколько там 2 в 160й степени вроде вариантов. 2 миллиарда записей. сколько раз надо прогнать 2 миллиарда условно разных записей, где дубликатов скажем, 10%, чтоб нарваться на коллизию когда два разных объекта дадут один хэш и мы потеряем данные потому что один из элементов выбросили?
|
Желаю успехов в поиске колизии SHA-256 . Это 2^256 вариантов. 2 миллиарда - это ~2^31. Таким образом, тебе, чтобы на практике нарваться на коллизию однозначно, потребуется прогнать 2^225 списков из двух миллиардов разных данных. Даже, если бы каждая запись занимала бы 1 байт (что делало бы борьбу с коллизиями, да и просто загрузку массива в память относительно тривиальной задачей), то все вместе это бы составляло поток данных из 2^226GiB. Для сравнения, объем всего интернета составляет 40*10^12GiB по оценкам на 2020 год.
Конечно, практическая вероятность встретить коллизию несколько выше (хотя, насколько мне известно, для SHA-256 ее до сих пор не нашли).
|