පරිගණක භාවිතයෙන් මුහුණු සජිවිකරණය

විකිපීඩියා, නිදහස් විශ්වකෝෂය වෙතින්
Jump to navigation Jump to search


කා‍ටුන් ආකාර සහ තාත්වික ආකාර කතා කරන හිස් යුගලක්[සංස්කරණය]

පරිගණක භාවිතයෙන් මුහුණු සජිවිකරණය පිලිබද ක්ෂේත්‍රය පරිගණකමය රූප නිර්මාණ ක්ෂේත්‍රයක් වන අතර එයට මානව හිසේ සහ මුහුණේ ආකෘති නිර්මාණය කිරීමේ සහ ඒවා සජීවිකරණය කිරීමේ ක්‍රමවේදයක් අයත් වෙයි. මෙහි විශය පථය සහ නිර්මාණ වර්ගය අනුව එය තවත් බොහෝ විද්‍යාත්මක සහ කලාත්මක ක්ෂේත්‍රයන් ගණනාවකට සම්බන්ධ වන අතර ඒවා අතරට මනෝ විද්‍යාවේ සිට සාම්ප්‍රදායික සජිවිකරණය දක්වා වු ක්ෂේත්‍ර අයත් වෙයි. වාචික සහ වාචික නොවන සංන්නිවේදනය සදහා මුහුණෙහි ඇති වැදගත් කමත් පරිගණක මෘදුකාංග සහ පරිගණක රූ නිර්මාණ දෘඩාංග වල වැඩි දියුණුවක් හේතුවෙන් පරිගණක භාවිතයෙන් මුහුණු සජිවිකරණ ක්ෂේත්‍රය වෙත විද්‍යාත්මක තාක්ෂණික සහ කලාත්මක වශයෙන් සැලකිය යුතු අවධානයක් යොමුව ඇත.

මුහුණු සජීවිකරණය සදහා පරිගණක රූ නිර්මාණ ක්‍රම සකස් කිරීම 1970 දශකයේ මුල භාගයේදී ආරම්භ වු නමුත් මෙම ක්ෂේත්‍රය විශාල දියුණුවකට පාත්‍රවීම වඩාත් නූතන සිදුවුවක් වන අතර එය 1980 දශකයේ අග භාගයේ පටන් ආරම්භ වුණි යැයි සැලකිය හැක.

පරිගණක භාවිතයෙන් මුහුණු සජිවිකරණය සදහා රූප නිර්මාණයේ පටන් ත්‍රිමාන ආකෘති නිර්මාණය සහ විදැහුම් කරණය දක්වා ක්‍රමවේද රැසක් පැවැත්වෙයි. මෙම තාක්ෂණය වෘතාන්ත චිත්‍රපට සහ පරිගණක ක්‍රිඩා ඔස්සේ ජනප්‍රියත්වයට පත්ව ඇති නමුත් සන්නිවේදනය, අධ්‍යාපනය, විද්‍යාත්මක අනුරූපණ නිර්මාණය සහ නියෝජිතයන් මත පදනම් වු පද්ධති (උදාහරණයක් ලෙස අන්තර් ජාලය හරහා ක්‍රියාත්මක වන පාරිභෝගික සේවා නියෝජිතයන් පෙන්වා දිය හැක‍) ආදි ක්ෂේත්‍ර සදහා ද මෙය ප්‍රයෝජනවත් වෙයි.

2D සජීවීකරණ[සංස්කරණය]

ද්විමාන මුහුණු පිළිබඳ සජීවීකරණය සාමාන්‍යයෙන් පදනම් වෙන්නේ රූප පරිවර්තනය කිරීම මතයි. මෙම රූපවලට නිශ්චල ඡායාරූප හා වීඩියෝ අනුක්‍රම ඇතුළත් වේ. රූප මෝර්ප් කිරීම යනු ඉලක්ක කරන ලද නිශ්චල ඡායාරූප 2ක් අතර හෝ වීඩියෝ අනුක්‍රමයක රාමු 2ක් අතර සංක්‍රාමී ඡායාරූප නිපදවීමට ඉඩ ලබා දෙන තාක්ෂණික ක්‍රමයකි. මෙම මෝර්ප් කිරීමේ තාක්ෂණික ක්‍රම සාමාන්‍යයෙන් සමන්විත වන්නේ ජ්‍යාමිතික විරූපණ තාක්ෂණික ක්‍රමවල සංයුක්තයකිනි. එමඟින් එම ඉලක්කගත රූප නිවැරදි ලෙස සකසන අතර රූප වයනයේ මෘදු සංක්‍රාමණයක් ඇති කරන ක්‍රොස් ෆේඩ් කිරීමක් ද සිදු කරයි. රූප මෝර්ප් කිරීමේ මුල් කාලීන උදාරහණයක් මයිකල් ජැක්සන්ගේ “Black or White” වී‍ඩියෝවෙහි දැකගත හැක. 1997 දී ජීව විද්‍යාත්මක හා පරිගණක අධ්‍යයන MIT මධ්‍යස්ථානයේ සේවය කරන එසාට් හා පොගියෝඩ් විසින් කතා කරන සජීවීකරණ නිර්මාණය සඳහා විසෙම්ස් (Visemes) නිරූපණය කරන රූප යතුරුරාමු අතර මෝර්ප් වන MikeTalk නමින් හඳුන්වන පද්ධතියක් නිර්මාණය කරන ලදී.

රූපවලින් වූ සජීවීකරණවල තවත් ආකාරයක් වීඩියෝ පටයකින් ග්‍රහණය කරන ලද අනුක්‍රම එකට ඈඳීමකින් සමන්විත වේ. 1997 දී Bregler et al. විසින් වීඩියෝ නැවත ලිවීම ලෙස හැඳින්වූ තාක්ෂණික ක්‍රමයක් විස්තර කරන ලදී. එහිදී නිරූපණය කරන්නෙකුගේ අඩියාව ශබ්දය පිළිබඳ වූ ඒකකවලට අනුරූපව කොටස්වලට වෙන්කරන අතර ඉන්පසු ඒවා එකට මිශ්‍ර කර කථකයාගේ නව සජීවීකරණ නිර්මාණය කරනු ලබයි. වීඩියෝ නැවත ලිවීම වීඩියෝවල වූ තොල් චලනයන් ස්වයංක්‍රීයව ග්‍රහණය කර ගැනීමට පරිගණක දෘශ්‍ය තාක්ෂණික ක්‍රම භාවිතා කරන අතර මෙම අංග වෙන් කර ගන්නා ලද ශබ්දය පිළිබඳ වූ ඒකක සකස් කිරීමේ දී හා මිශ්‍ර කිරීමේ දී යොදා ගනී. මෙම සජීවීකරණ තාක්ෂණික ක්‍රමය මඟින් නිර්මාණය වනු ලබන්නේ, මුහුණෙහි පහළ කොටසේ සජීවීකරණ පමණි. ඉන්පසු මේවා නිරූපණය කරන්නාගේ වීඩියෝ සමඟ එකට සම්බන්ධ කර අවසාන සජීවීකරණය නිෂ්පාදනය කරනු ලබයි.

මුහුණු සජීවිකරණ භාෂා[සංස්කරණය]

බොහෝ මුහුණු සජිවීකරණ භාෂා මුහුණු සජිවි කරණයෙහි අන්තර්ගතය විස්තර කිරීමට භාවිතා කෙරෙයි. ඒවා එම භාෂා සදහා අනුකූල වන දාවක මෘදුකාංග භාවිතය අදාල චලනයන් ජනනය සදහා භාවිතා කළ හැක. මුහුණු සජිවීකරණ භාෂා SMIL සහ VRML වැනි අනෙකුත් බහු මාධ්‍ය භාෂාවන් හා සමීප සම්බන්ධතාවක් දක්වයි. දත්ත නිරූපණ ක්‍රම‍වේදයක් ලෙස XML හි ඇති සාධනත්වය සහ ප්‍රචලිත භාවය හේතුවෙන් බොහෝ මුහුණු සජීවිකරණ භාෂා XML මත පදනම් වේ. උදාහරණයක් ලෙස පහත දක්වා ඇති Virtual Human Markup Language (VHML) භාෂාවේ නියැදිය බලන්න.

<vhml>

 <person disposition="angry">
   First I speak with an angry voice and look very angry,
   <surprised intensity="50">
     but suddenly I change to look more surprised.
   </surprised>
 </person>

</vhml>

වඩාත් සංකිර්ණ භාෂා භාවිතයේදී තිරණ ගැනීම, අවස්ථාවන්ට මුහුණ දීම සහ සමාන්තර සහ අනුක්‍රමික ක්‍රියාවලීන් සදහා ද ඉඩකඩ ලැබේ. පහත දක්වා ඇත්තේ Face Modeling Language (FML) භාෂා නියැදියකි.

<fml>

 <act>
   <par>
       <hdmv type="yaw" value="15" begin="0" end="2000" />
       <expr type="joy" value="-60" begin="0" end="2000" />
   </par>
   <excl event_name="kbd" event_value="" repeat="kbd;F3_up" >
       <hdmv type="yaw" value="40" begin="0" end="2000" event_value="F1_up" />
       <hdmv type="yaw" value="-40" begin="0" end="2000" event_value="F2_up" />
   </excl>
 </act>

</fml>