"Razbili smo genom engleskoga glasa", tvrdi Ed Stratton, osnivač i predsjednik britanske tvrtke Zero-G koja je dobila licencu za Vokaloid od Yamahe.
U teoriji, Vokaloid se može programirati da pjeva kao bilo koji pjevač, od Edith Piaf do Eminema. Međutim, zasad će taj proizvod biti ograničen na glasove dva profesionalna pjevača soula.
Umjetno proizvesti ljudsko pjevanje teže je od oponašanja govora jer uključuje tekst i melodiju. Također je teže od sintetiziranja većine glazbenih instrumenata jer glas ima širi raspon prijelaza između zvukova.
Vokaloid rješava taj problem razbijanjem ljudskog glasa na 2.500 fonema, koje su prijelazi između samoglasnika i suglasnika.
Softver Vokaloid izvlači ključne dijelove tih fonema i uzima zvuk i izgovor specifičan za određenog pjevača te ih pretvara u matematičku formu koju čuva u bazi podataka.