در حالی که فناوری VocaliD هنوز در مراحل اولیه است و کارشناسان در حال تکمیل فرایند ضبط صدا هستند اما امیدوارند از یک برنامه اینترنتی یا اپلیکیشین تلفن همراه استفاده کنند تا مردم بتوانند صدای خود را از راه دور و در یک محیط ساکت ضبط کنند چرا که هرچه این ضبط بهتر صورت گیرد صوت ایجاد شده واقعی تر می شود.
کارشناسان در VocaliD برای ایجاد یک صدای سفارشی، آنچه را که یک فرد مبتلا به آسیب دیدگی صوتی می تواند تولید کند را استخراج می کنند و سپس آن را به یک صدای مصنوعی که بخشی از آن توسط یک اهدا کننده صدا ایجاد شده، ترکیب می کنند.
صدای اهدایی بر اساس جنسیت و سن انتخاب می شود از این رو صدای مصنوعی جدید آنها تا جایی که امکان داشته باشد حاوی هویت صوتی اصلی شان خواهد بود اما با شفافیت و وضوح بیان صدای اهدایی.
این ایده ساده ای است که می تواند تاثیر قدرتمندی بر روی زندگی افرادی بگذارد که برای حرف زدن به صدای مصنوعی تکیه دارند.
VocaliD تخمین می زند که ده ها میلیون نفر در سراسر جهان به صدای رایانه ای برای برقراری ارتباط نیاز دارند. گزینه های بسیار محدود در دسترس، اغلب شخصیت ندارند و صدا مانند یک رایانه به گوش می رسد.
کارشناسان از چندین هزار جمله ضبط شده توسط یک اهدا کننده استفاده می کنند تا یک صدای جدید بسازند.
فرایند ضبط صدا دو تا سه ساعت طول می کشد و اهدا کننده جملات کوتاه را می خواند و تکرار می کنند که در کنار هم تمامی ترکیبات صوتی موجود در زبان انگلیسی را پوشش می دهد.
کارشناسان پس از ضبط صدا از نرم افزاری برای ترکیب صدای اهدایی با صدای دریافت کننده یا همان بیمار استفاده کرده تا واحد های گفتار مانند حروف صدا دار و بی صدا را بسازند.
وقتی تمامی این واحد ها ایجاد شد صدای مصنوعی خلق می شود و به بیمار امکان می دهد تا هر جمله ای را حتی آنهایی که پیشتر توسط فرد اهدا کننده از قبل ضبط نشده باشد به راحتی بیان کند.