Аудио без потерь
Как обычно, Apple сделала из обычной вещи что-то, кажущееся грандиозным и инновативным, хотя на самом деле это и не так, но это не имеет значения в текущем контексте. Если дать этому короткую оценку, то можно сойтись на том, что это действительно важно и создаст довольно большой импакт, повлияв на стриминг в целом.
В данный момент аудио в формате без потерь (lossless) и аудио Dolby Atmos доступно только на устройствах Apple, пользователям всех остальных платформ придется подождать неопределенное время, пока оно доедет хотя бы на Android.
Что касается Lossless, то это то, что заметит каждый, даже используя убогие AirPods, которые в данный момент не способны получит качественное аудио по Bluetooth, поэтому при передаче потери все же будут, но такой звук может показаться чище и приятнее, но, возможно, звучать будет не так громко. Настоящее же применение будет в связке с устройствами, которые используют Apple AirPlay либо при использовании дополнительного USB ЦАП, коих нынче много.
Нужен ли вообще Dolby Atmos и что это такое – на этот вопрос лучше поискать ответ в других местах. Такое аудио поддерживается в Tidal, но я не являюсь фанатом этих маркетинговых фишек, поэтому на скриншоте и видно, что оно в выключенном положении. Долби атмос звучит вообще как-то по-вейперски, а вейп и все шутки о нем вымерли еще в 2017 году. Будет ли Dolby Atmos в Android – никто не знает, скорее всего нет, разве что на некоторых аппаратах Samsung. Но можно с уверенностью сказать, что это ненужная технология, поэтому расстраиваться не стоит, а стоит радоваться приходу Lossless качества на портативы, да еще и без повышения цен (пока что).
Дальше в этом посте будет непонятная тарабарщина, которую можно пропустить, ведь основное уже сказано. Но если интересно, то читаем дальше.
Я же ждал этого еще с 2010 года, когда пользовался iPod. Тогда я задавался вопросом “Почему же Apple продает музыку в AAC, если у них уже есть нужный кодек?”. Ответа на данный вопрос я все еще не знаю, но это теперь неважно, ведь 7 Июня 2021 года звук без потерь увидел стриминговый сервис Apple Music.
Так что же значит “Без потерь? А что, раньше были потери?” – наверняка подумают те, кто никогда не вдавался в подробности и покупал AirPods Pro как только они вышли, хотя все еще имел рабочие AirPods первой ревизии и в принципе был рад тому, что весь такой модный и оригинальный (косплей на типичного жителя столицы, который два года назад переехал из поселка городского типа).
Раньше, начиная еще с айподов нано, когда флеш память стоила дорого, а аудио было исключительно офлайновым, музыка в iTunes Store поставлялась в формате AAC с битрейтом 256 килобит в секунду. Песня из трех минут в таком формате занимала около 8 мегабайт в памяти, а качество аудио было уже на втором плане. Многие треки в фирменном магазине с пометкой iTunes Remaster означали, что сведение этого трека было выполнено так, чтобы человеческое ухо не смогло обнаружить потери, которые произошли в ходе перекодирования из мастер аудио в сжатое аудио. Много ли мы теряли? Аудиофилы ответят, что потеряли вообще все, включая смысл жизни, но обычный смертный снова не поймет, о каких вообще потерях идет речь.
Вернемся в прошлое. Нет, не к тому моменту, когда музыка была лишь на виниле и на кассетах, этот период нас сейчас не интересует, поскольку относится к аналоговому аудио. Мы же попадем в период, когда музыка переехала в цифру, а это начало 1980х годов, когда вышел первый музыкальный альбом в формате Audio CD, и, как понятно из названия, он поставлялся в виде компакт-диска. Компакт диск это своего рода флешка на 700 мегабайт. Он тоже хранит информацию в двоичном виде, при чтении лазерная головка при успешном отражении от поверхности CD диска возвращает 1 или 0, и таких единиц и нулей в такой диск можно записать аж 700 миллионов. Но как же понять, что это за единицы и нули и почему это должно “звучать”? А все просто, это уже не аналоговое аудио, которое записано в виде магнитных искажений, а самая обычная цифровая кодировка звуковой волны. То есть, кто-то взял, поставил аналоговый микрофон к магнитофону, в который вставлена аудиокассета, нажал Play и то, что приходит на микрофон снял 44100 раз в секунду и закодировал так столько секунд, сколько идет вся запись. Каждая секунда звука в реальном мире была разделена на 44100 ровных ячеек и для каждой из них был взят показатель громкости звука и закодирован в 16 бит (На данном графике показана 4х битное кодирование, при 16 битном кодировании максимальная вершина графика будет в 1111 1111 1111 1111 – в двоичной системе, то есть 2 в 16 степени = 65536 в десятичной). Прошу заметить, что это число сильно отличается от числа 15.
Могу быть неточен в каких-то аспектах, однако надеюсь, что суть будет донесена. Если что, про импульсно-кодовую модуляцию почитать можно на вики.
Глубина кодирования отвечает за динамический диапазон. В реальном мире звук взлетающего самолета может запросто оглушить и даже причинить вред слуховым органам, но оцифрованный же звук взлетающего самолета этого сделать не сможет, хоть и создаст неприятные ощущения при прослушивании, если записан с перегрузом уровня записи, но если же чувствительность микрофонов была уменьшена, то звук на записи будет более менее однотонным, но отличить тихий звук от громкого все еще будет возможно, потому что есть всего 65535 ступеней для измерения уровня громкости (16 бит), чего вполне достаточно, чтобы измерить громкость от -120 децибел (самый тихий звук) до 0 децибел (реальная громкость, без доп усиления).
С глубиной определились. Вернемся к частоте дискретизации. Для аудио дисков она равна 44100 герц. Почему же такое число? С уроков физики мы знаем, что человек слышит звук в диапазоне от 20гц (в данном случае герц – это количество колебаний) до 20 000 герц. На самом деле, с возрастом слух ухудшается, поэтому 20кгц вряд ли кто услышит, разве что с довольно сильным усилением, но там все равно нет никаких звуков (нужных) поэтому пропустим этот факт. Итого, у нас есть два канала (правый и левый, стерео), каждый канал должен содержать максимально точный сигнал в диапазоне от 20Гц до 20кГц.
Как следует из теоремы Котельникова, для того, чтобы однозначно восстановить исходный сигнал, частота дискретизации должна более чем в два раза превышать наибольшую частоту в спектре сигнала. – Вики
Отсюда и взяли 44100. Есть еще 48000, 96000 и 19200 гц (бывает еще и 352000, а то и больше). Остановимся на максимуме в 192000. При таком снятии одна секунда аудио будет разбита на 192 000 равных частей и это позволит еще более точно снять и воспроизвести потом аналоговый сигнал.
Итак, вернемся к аудио дискам. Они сегодня главные. Аудио в таком формате было записано на аудио диск, треки друг от друга отделялись небольшим зазором, чтобы проигрыватель знал, куда поставить головку, чтобы воспроизвести десятый трек, например, но зазора могло и не быть, все равно информация о треках содержится в самом начале диска, именно оттуда проигрыватель читает информацию о том, сколько треков и где каждый из них начинается. Иногда в самом первом зазоре на аудио дисках прятали секретный трек, воспроизвести который могли лишь некоторые проигрыватели, если зажать перемотку назад, они могли воспроизвести нулевой трек. В некоторых дисках там была не музыка, а, например, компьютерная мини игра. Все это можно отнести к пасхалкам, такое делается и по сей день.
И так, если вытащить какой-нибудь трехминутный трек из этого диска, его можно будет сохранить в контейнер в формате WAV. Это то самое аудио без потерь (ну, потери при записи с аналога не в счет, естественно), которого и предлагает сегодня Apple в своем музыкальном сервисе, наряду с Spotify (анонсировано, будет доступно в 2021 году), Tidal (уже доступно, официально нет в России), Deezer (уже доступно), Qobuz (уже доступно, но не в России), Amazon HD (уже доступно, но не в России), СберЗвук (непонятно, что там, но что-то есть).
Lossless
Такое аудио в формате WAV продолжительностью в три минуты будет занимать около 40 мегабайт на диске. Это не так уж и много в наши дни, однако если что-то можно сжать, то почему бы это не сделать? Тут и вступаются форматы сжатия без потерь, такие как FLAC, APE, ALAC и тд.
Остановимся на ALAC – Apple Lossless Audio Codec. Это далеко не новый формат, он существует еще с эпохи айподов. Допустим, iPod Nano 4-ого поколения спокойно может его прочитать, как и любой iPhone, iPad. Именно в этом формате будет передаваться вся музыка в Apple Music, к тому же обещают, что ее можно будет купить в таком формате, что радует. Данный кодек раньше был полностью закрытым, ни один конвертер третьих сторон не мог создать версию в этом формате, кроме iTunes. Но сегодня это уже не так, есть множество конвертеров, способных сжать аудио в этот формат или разжать из него WAV. Воспроизведение ALAC поддерживается на сегодняшний день множеством плееров, даже китайских вроде Fiio X5 или нашумевших Sony Walkman. Большинство Android устройств способны воспроизвести такое аудио с легкостью.
Вот аудио в формате Apple Lossless.FLAC – Free Lossless Audio Codec. Как следует из названия, это бесплатный кодек, поэтому его воспроизводит большинство устройств. Так же, как и Apple Lossless, оно сжимает исходный WAV файл так, что при его декодировании (Если обратно преобразовать FLAC в WAV) ничего не потеряется.
Вот то же аудио в формате FLAC.Они абсолютно идентичны при воспроизведений, однако каждый имеет свой алгоритм, который позволил сжать этот файл с 74 мегабайт до ~50 мегабайт
Уменьшение размера нужно для того, чтобы оптимизировать хранение и доставку аудио до устройств. В лучших традициях Apple, конечно же, была реализована защита от копирования скачанного аудио, поэтому оно приходит на устройство в таком вот неизвестном формате. Полагаю, что это зашифрованный ALAC, который сначала расшифруется, получив ключ от сервера Apple, а потом декодируется в WAV, чтобы в конечном итоге это воспроизвести. Однако все это будет делаться прозрачно, используя лишь ресурсы процессора устройства и оперативную память.
HiRes Audio
Но что же будет, если повысить глубину до 24 бит? Представили себе 24 единицы? В десятичном представлении это будет 16 777 216. Ого какая разница? В целых 256 раз больше, чем в 16 битном кодировании. Вот это и называется аудио высокого разрешения, иначе говоря, тот самый HiRes. В 24битном кодировании звук взлетающего самолета будет поначалу еще тише, а потом дойдет до своего пика громкости, и тут-то и можно будет оценить, какой переход от тихого звука к громкому и снова к тихому вплоть до полного исчезновения еле слышного свиста двигателей. Однако для аудио дисков
Apple Music хорош тем, что предлагает также аудио в формате вплоть до 192кГц и 24 бит, конкурент здесь ему только Qobuz, который стоит в несколько раз дороже и недоступен в некоторых странах, в то время как Apple Music предлагает то же самое почти что задаром (за цену стандартной подписки). Правда пока что мне не удалось найти ни один файл, который бы был доступен в этом формате. В конкуренцию можно также добавить Tidal, он способен предложить те же самые 192Кгц, но в своем формате – MQA, который еще совсем новый и бессмысленный и который не взлюбили все аудиофилы, поскольку для его прослушивания потребуется программный плеер с поддержкой MQA и ЦАП, способный полностью раскрыть то, что выдаст приложение. В противном случае это будет аудио с минимальными потерями в ультразвуке и тд. В общем, звучит мутно, поэтому Apple выглядит неплохим решением, кроме того факта, что веб версия плеера ужасна и вряд ли получит поддержку Lossless, но мы будем наблюдать, как все обернется. Конкуренция всегда благоприятна для потребителей.