വർഷം 2005, അറ്റ്ലാന്റയിലെ ഒരു സാധാരണ വോയ്സ് ആക്ടറും ഗായികയുമായിരുന്നു സൂസൻ ബെന്നറ്റ്. ജിംഗിളുകൾ പാടിയും മറ്റ് പരസ്യങ്ങൾക്ക് ശബ്ദം നൽകിയുമൊക്കെയായിരുന്നു അവരുടെ ജീവിതം. ഒരു ദിവസം, ഒരു വോയ്സ് റെക്കോർഡിംഗിനായി വരേണ്ടിയിരുന്ന ആൾ വരാതിരുന്നപ്പോൾ, സ്റ്റുഡിയോ ഉടമ സൂസനോട് ഒരു ഭാഗം വായിക്കാൻ ആവശ്യപ്പെട്ടു. സൂസന്റെ ശബ്ദത്തിന് ഒരു പ്രത്യേക പ്രാദേശിക ശൈലിയോ കുറവോ ഇല്ലാത്തതിനാൽ ആ വോയ്സ് ഓവർ അവർക്ക് ചെയ്യാൻ സാധിച്ചു. അതോടെ വോയ്സ് ഓവർ മേഖലയിൽ ഒരു പുതിയ കരിയറിന് അവർ തുടക്കമിട്ടു.(Susan Bennett, the original voice of Siri)
ആ വർഷം ജൂലൈ മാസത്തിൽ സ്കാൻസോഫ്റ്റ് എന്ന സോഫ്റ്റ്വെയർ കമ്പനി ഒരു ഡാറ്റാബേസ് പ്രോജക്ടിനായി ഒരു ശബ്ദം തേടി. ടെക്സ്റ്റ്-ടു-സ്പീച്ച് സാങ്കേതികവിദ്യക്ക് വേണ്ടിയുള്ളതായിരുന്നു ആ പ്രോജക്റ്റ്. ഇതിലൂടെ കമ്പ്യൂട്ടറിന് മനുഷ്യന്റെ സംസാരശൈലി അനുകരിക്കാനാകും. സ്കാൻസോഫ്റ്റ് ഈ ജോലി ജിഎം വോയ്സ് എന്ന കമ്പനിയെ ഏൽപ്പിച്ചു, അവർ സൂസൻ ബെന്നറ്റിനെ തിരഞ്ഞെടുത്തു.
അർത്ഥമില്ലാത്ത വാചകങ്ങളും വിരസമായ റെക്കോർഡിംഗുകളും
അതൊരു സാധാരണ വോയ്സ് ഓവർ ജോലിയായിരുന്നില്ല. സൂസന്റെ സംസാരത്തിലെ ഓരോ ശബ്ദവും, ഓരോ സ്വരാക്ഷരവും വ്യഞ്ജനാക്ഷരവും, വാക്കുകളുടെ എല്ലാവിധ ശബ്ദകോമ്പിനേഷനുകളും പിടിച്ചെടുക്കുക എന്നതായിരുന്നു ലക്ഷ്യം. ഇതിനായി പ്രോഗ്രാമർമാർ സൃഷ്ടിച്ച ആയിരക്കണക്കിന് വാചകങ്ങളാണ് അവർ വായിക്കേണ്ടിയിരുന്നത്.
ഉദാഹരണത്തിന്, "Cow hoist in the tub hut today" എന്നതുപോലെയോ, അല്ലെങ്കിൽ ഒരു വാക്ക് തന്നെ വ്യത്യസ്തമായ സ്വരങ്ങൾ മാറ്റിക്കൊണ്ട് പലതവണ ആവർത്തിച്ചോ ആയിരുന്നു റെക്കോർഡിംഗ്. ഒരു മാസത്തോളം, ആഴ്ചയിൽ അഞ്ച് ദിവസവും, ദിവസവും നാല് മണിക്കൂറിലധികം സൂസൻ തന്റെ ഹോം സ്റ്റുഡിയോയിൽ ഇരുന്ന് ഈ വിരസമായ വാചകങ്ങൾ ഒരേ ടോണിലും വേഗതയിലും വായിച്ചു.
ഈ ശബ്ദങ്ങൾ പിന്നീട് കൺകാറ്റിനേഷൻ എന്ന പ്രക്രിയയിലൂടെ ചെറിയ ചെറിയ ശബ്ദ യൂണിറ്റുകളായി വേർതിരിക്കുകയും, ആ യൂണിറ്റുകൾ കൂട്ടിച്ചേർത്ത് പുതിയ വാക്കുകളും വാചകങ്ങളും സൃഷ്ടിക്കാൻ കഴിയുന്ന ഒരു സിന്തറ്റിക് വോയ്സ് (Synthetic Voice) ആയി മാറ്റുകയും ചെയ്തു. ഇതെന്തിനാണ് ഉപയോഗിക്കാൻ പോകുന്നതെന്ന് സൂസനോടോ മറ്റ് വോയ്സ് ആക്ടർമാരോടോ കമ്പനി പറഞ്ഞിരുന്നില്ല. ഒരു സാധാരണ ഫോൺ സിസ്റ്റത്തിന് വേണ്ടിയുള്ള റെക്കോർഡിംഗ് ആയിരിക്കുമെന്നാണ് അവർ കരുതിയത്.
2005-ലെ ആ റെക്കോർഡിംഗുകൾ ഒരു വോയ്സ് ഡാറ്റാബേസിൽ സുരക്ഷിതമായി ഇരുന്നു. ആപ്പിളുമായി സൂസൻ നേരിട്ട് കരാറിലായിരുന്നില്ല. ടെക്സ്റ്റ്-ടു-സ്പീച്ച് വോയ്സുകൾ നൽകുന്ന Nuance പോലുള്ള കമ്പനികളിൽ നിന്നാണ് ആപ്പിൾ അവരുടെ വോയ്സുകൾ വാങ്ങിയത്. വർഷങ്ങൾക്കിപ്പുറം, 2011 ഒക്ടോബർ 4-ന് ആപ്പിൾ ഐഫോൺ 4എസ് പുറത്തിറക്കി. അതോടൊപ്പം ഒരു വിപ്ലവകരമായ ഫീച്ചറും: സിരി, വോയ്സ്-ആക്ടിവേറ്റഡ് വെർച്വൽ അസിസ്റ്റന്റ്സ് !
സിരി
ഒരു ദിവസം സൂസന്റെ ഒരു സുഹൃത്ത് അവർക്കൊരു ഇമെയിൽ അയച്ചു. പുതിയ ഐഫോൺ ആപ്പായ സിരിയുടെ ശബ്ദം സൂസന്റേതുപോലെ തോന്നുന്നുണ്ടല്ലോ എന്നായിരുന്നു അതിൽ. ആദ്യമായി ആ ശബ്ദം കേട്ടപ്പോൾ സൂസൻ അമ്പരന്നുപോയി! താൻ റെക്കോർഡ് ചെയ്ത വോയ്സ് ഇത്രയധികം പരിഷ്കരിക്കപ്പെട്ട് ഒരു വെർച്വൽ അസിസ്റ്റന്റായി മാറിയത് അവർ അറിഞ്ഞിരുന്നില്ല. ഇത്തരമൊരു സാങ്കേതികവിപ്ലവത്തിൽ താനും ഒരു ഭാഗമായെന്ന് അവർ അപ്രതീക്ഷിതമായി തിരിച്ചറിഞ്ഞു.
ഒരു രഹസ്യം പരസ്യമാക്കുന്നു
രണ്ട് വർഷത്തോളം സൂസൻ തന്റെ ഈ രഹസ്യം രഹസ്യമായി തന്നെ സൂക്ഷിച്ചു. പൊതുജനങ്ങൾക്കിടയിൽ അവരുടെ അജ്ഞാത ശബ്ദം ഒരു കഥാപാത്രമായി മാറിയതോടെ താൻ മറ്റ് വോയ്സ് ഓവർ ജോലികൾക്ക് ടൈപ്പ്കാസ്റ്റ് ചെയ്യപ്പെടുമോ എന്ന് അവർ ഭയന്നു.
എങ്കിലും, 2013-ൽ ടെക്നോളജി വെബ്സൈറ്റായ സിഎൻഎൻഐ ഒരു വീഡിയോയിൽ സിരിയുടെ യഥാർത്ഥ ശബ്ദം തന്റേതാണെന്ന് അവർ വെളിപ്പെടുത്തി. ഇതോടെ സൂസൻ ബെന്നറ്റ് ലോകമെമ്പാടും ശ്രദ്ധിക്കപ്പെട്ടു. ലോകത്തിലെ ഏറ്റവും പ്രശസ്തമായ ശബ്ദത്തിന് പിന്നിലെ മുഖമായി അവർ മാറി. തുടക്കത്തിൽ സിരിയുടെ പ്രതികരണങ്ങൾക്ക് ഒരു ചെറിയ "സെൽഫ്-ആറ്റിറ്റ്യൂഡ്" ഉണ്ടായിരുന്നു. എന്നാൽ 2013-ൽ iOS 7 പുറത്തിറങ്ങിയപ്പോൾ ആപ്പിൾ സിരിയുടെ ശബ്ദം കൂടുതൽ ന്യൂട്രലായ മറ്റൊരാളിലേക്ക് മാറ്റി. എങ്കിലും, സിരിയുടെ ശബ്ദത്തിന് ഒരു വ്യക്തിത്വം നൽകിയതിന്റെ ക്രെഡിറ്റ് ഇപ്പോഴും സൂസൻ ബെന്നറ്റിനാണ്.
ഇന്ന്, സൂസൻ തന്റെ ഈ അപ്രതീക്ഷിത പ്രശസ്തി ഒരു പ്രചോദനാത്മക പ്രസംഗകയായും വോയ്സ് ആക്ടറായും തുടരാൻ ഉപയോഗിക്കുന്നു. ലോകത്തെ കോടിക്കണക്കിന് ആളുകൾ ആദ്യമായി കേട്ട ആ സവിശേഷമായ വെർച്വൽ ശബ്ദം ഒരു സാധാരണ വോയ്സ് ആക്ടറുടേതായിരുന്നു, അതും അറിഞ്ഞുകൊണ്ട് റെക്കോർഡ് ചെയ്തതല്ല എന്നതാണ് ഈ കഥയിലെ ഏറ്റവും വലിയ വിസ്മയം.