A questo punto, ogni traccia (sia essa la traccia da classificare, oppure una traccia nel database) viene descritta nel tempo dagli hash trovati. Ora, al lato client (smartphone), viene spedito verso il server solamente l'hash (64bit) relativo ai 10-15 secondi di traccia (13-20 KB), ottenendo un'occupazione di banda inferiore rispetto alla completa trasmissione della trasformata o del segnale originale.
A lato server, verranno ora confrontati i nuovi hash provenienti dal dispositivo mobile, con gli hash precedentemente calcolati per ogni canzone del database. Il confronto [Fig.07-08], svolto sulle componenti dell'hash, restituisce il riconoscimento o meno della canzone registrata.
[1] "An industrial-strength audio search algorithm" by Avery Li-chun Wang , Th Floor Block F; Shazam Entertainment, Ltd.; 2003. link
[2] "A Review of Algorithms for Audio Fingerprinting" by Pedro Cano and Eioi Batlle, Ton Kalker and Jaap Haitsma; link
[3] "Fingerprinting to identify repeated sound events in long-duration personal audio recordings" by James P. Ogle and Daniel P.W. Ellis, Columbia University; link
[4] "A Highly Robust Audio Fingerprinting System" by Jaap Haitsma and Ton Kalker; link