Jump to content

වෙකා((Weka)යන්ත්‍රික ඉගෙනීම)

විකිපීඩියා වෙතින්
Weka
Weka 3.5.5 with Explorer window open with Iris UCI dataset
සංවර්ධක(යෝ)University of Waikato
ස්ථායි නිකුතුව
3.8.1 (stable) / අප්‍රේල් 14, 2016; වසර 8 කට පෙර (2016-04-14)
පූර්ව දර්ශන නිකුතුව
3.9.1 / දෙසැම්බර් 19, 2016; වසර 7 කට පෙර (2016-12-19)
ක්‍රමලේඛන භාෂා(ව)Java
මෙහෙයුම් පද්ධතියWindows, OS X, Linux
පරිගණක වේදිකාවIA-32, x86-64; Java SE
වර්ගයMachine learning
බලපත්‍රයGNU General Public License
වෙබ් අඩවියcs.waikato.ac.nz/~ml/weka

වෙකා (Waikato Environment for Knowledge Analysis (Weka)) යනු ජාවා මගින් ලියු යාන්ත්‍රික ඉගෙනීම් මෘදුකාංගයන්හි ජනප්‍රිය ආම්පන්යකි. එය  නවසීලන්තය Waikato විශ්ව විද්‍යාලයේ සංවර්ධනය කර තිබේ. එය GNU General Public License යටතේ අවසර ලබා තිබෙන නිදහස් මෘදුකාංගයකි.

විස්තරය

[සංස්කරණය]

වෙකා ( මෙකා සමග රසයට ශබ්ධ උච්චරනය) යනු  කාර්යමේසයකි.[1] එය දෘශ්‍යයමය මෙවලම් එකතුවක් සහ දත්ත විශ්ලේෂණය සඳහා ඇල්ගොරිතම සහ අනාවැකි ආකෘති නිර්මාණයන්ගෙන් සමන්විත වේ. ඒ  සමග එක්ව මෙම කාර්යයන්ගෙ පහසු ප්‍රවේශය සදහා චිත්රක පරිශීලක අතුරුමුහුණත් තිබේ.වෙකා හි මුල් ජාවා නොවන අනුවාදය, අනෙකුත් භාශා ක්‍රියාත්මක (වැඩි වශයෙන් තෙවන පාර්ශවීය) ආකෘති නිර්මාණය ඇල්ගොරිතම සඳහා Tcl / Tk ඉදිරිපස අවසානයක් සමග සී උපයෝගිතා  පෙර-සැකසුම් දත්ත සහ යාන්ත්‍ර ඉගෙනුම් පරීක්ෂණ ධාවනය සඳහා Makefile-පදනම් වූ පද්ධතියකින් සමන්විත විය.මෙම මුල් අනුවාදය මූලික වශයෙන් කෘෂිකාර්මික වසම්[2][3] වලින් ලැබෙන දත්ත ගැඹුරින් විශ්ලේෂණය සඳහා මෙවලමක් ලෙස නිර්මාණය කරන ලදී.නමුත් වඩාත් නූතන පූර්ණ ජාවා පදනම් කරගත් අනුවාදය (වෙකා 3)  සංවර්ධන 1997 දී ආරම්භ කරන ලදී.එය දැන් බොහෝ වෙනස් අයදුම් ප්‍රදේශ, විශේෂිත අධ්‍යාපන අරමුණු සහ පර්යේෂණ සඳහා භාවිතා වේ. වෙකා වල පහත වාසි ඇතුළත් වේ:

  •  GNU General Public License යටතේ නිදහස් ලබාගත හැක.
  • පහසුවෙන් එහාමෙහා ගෙන යාමේ, එය සම්පූර්ණයෙන්ම  ජාවා පරිගණක භාෂාවෙන්  ක්‍රියාත්මක වන අතර ඒ අනුව ඕනෑම නවීන පරිගණක වේදිකාවක් මත ධාවනය වේ.
  • දත්ත පෙර-සැකසුම් හා ආකෘති නිර්මාණ තාක්ෂණයන්ගේ පුළුල් එකතුවකි.
  • එහි චිත්රක පරිශීලක අතුරුමුහුණත් නිසා භාවිතයේ පහසුව.

සම්මත  දත්ත කැණීම කාර්යයන් කිහිපයකට වෙකා සහය වෙයි, ඒ අතරින් දත්ත පෙර-සැකසුම්, පොකුරු ගත කිරීම, වර්ගීකරණය, ප්‍රතිගමනය, දෘශ්‍යයමය සහ ලක්ෂණ තේරීම වඩාත් විශේෂිත වේ. වෙකාගේ ශිල්ප ක්‍රම සියල්ල, එක් එක් දත්ත ලක්ෂ්‍යය, නියත ගුණාංග සංඛ්‍යාවක් විසින් විස්තර කරනු ලබන දත්ත එක් පැතලි ගොනුවක් හෝ සම්බන්ධයක් ලෙස ලබා ගත හැකි බව යන උපකල්පනය මත පාදක වේ(සාමාන්‍යයෙන්, සංඛ්‍යාත්මක හෝ නාමික ගුණාංග, නමුත් සමහර අනෙකුත් ගුණාංග වර්ග සදහාද සහාය දක්වයි).වෙකා,  SQL දත්ත සමුදායන්ට ප්‍රවේශය  ජාවා දත්ත සමුදායේ සම්බන්ධතාවය භාවිතයෙන් සපයයි සහ දත්ත සමුදායේ විමසුමක් විසින් ආපසු ලබා දෙන ප්‍රතිඵලය මගින් සැකසීමට හැක.එයට බහු-සම්බන්ධක දත්ත කැණීම් කළ නොහැක, නමුත් මෙහි තනි වගුවක් තුලට සම්බන්ධ දත්ත සමුදාය වගු එකතුවක් බවට පත් කිරිම සදහා වෙනම මෘදුකාංග ඇත.එය වෙකා[4]  භාවිතයෙන් සැකසීම සඳහා සුදුසු වේ.අනුක්‍රමය ආකෘති නිර්මාණය යනු දැනට වෙකා බෙදාහැරීමේ ඇතුළත් ඇල්ගොරිතම මගින් ආවරණය නොවන තවත් වැදගත් ප්‍රදේශයක් වේ.


පරිශීලක අතුරු මුහුණත්

[සංස්කරණය]

වෙකාගේ  ප්‍රධාන පරිශීලක අතුරු මුහුණත Explorer වේ. නමුත් අත්‍යවශ්‍යයෙන්ම එකම ක්‍රියකාරිත්වය සංරචක මත පදනම් දැනුම ප්‍රවාහ අතුරු මුහුණත හරහා සහ  විධාන රේඛාවේ  සිට පිවිසිය හැකිය.මෙහි Experimenter ද පවතී. එය වෙකාගේ යාන්ත්‍රික ඉගෙනුම් ඇල්ගොරිතම දත්ත කාණ්ඩ එකතුව මත අනාවැකි කාර්ය සාධනයහි විධිමත් සංසන්දනයට අවස්ථාව ලබා දෙයි.


Explorer අතුරුමුහුණත් වල සමහර පුවරු ලක්ෂණ, workbench හි ප්‍රධාන සංරචකයන්ට ප්‍රවේශය සපයයි:

  •  දත්ත සමුදායකින්, CSV ලිපිගොනුවකින් (comma-separated values ) ආදියෙන් දත්ත ආනයනය කිරිම සදහා පෙර සැකසුම් පුවරු පහසුකම් සපයා ඇත.  තවද  මෙම දත්ත වල පෙර සැකසීම සදහා පෙරහන් ඇල්ගොරිතමක් භාවිතා කරයි.මෙම පෙරහන්, දත්ත පරිවර්තනය කිරීමට ( උදාහරණයක් ලෙස සංඛ්‍යාත්මක ගුණාංග විවික්ත එකක් බවට පරිවර්තනය )සහ අවස්ථා මකා  දැමීමට ඇති හැකියාවට සහ නිශ්චිත නිර්ණායකයකට අනුව ගුණාංග සදහා භාවිතා කල හැක.
  • මෙම විද්වත් කමිටු වර්ගීකරණයට , වර්ගීකරණය  සහ  ප්‍රතිගමනය  ඇල්ගොරිතම ( වග විභාගයක් නැතිව වෙකා තුළ  classifiers  නම් වේ.) දත්ත සමුදයේ ප්‍රතිඵලයට,  එහි ප්‍රතිඵල අනාවැකි ආදර්ශයේ   නිරවද්‍යතාව  තක්සේරු කිරිමට, සහ වැරදි සහගත අනාවැකි මවාගැනීමට, සහ ලබන්නා ක්‍රියාත්මක ලක්ෂණ (receiver operating characteristic (ROC) )වක්‍ර ආදිය හෝ එහිම අනුකෘතියට ( අනුකෘතිය දෘශ්ටි කල්පනය ආදියට නම්‍යශීලී නම්, උදාහරණය:- තීරණ ගස) අයදුම් කිරිමට හැකියාව ඇත.
  • සහායක කමිටුව, සංගමයේ නීති ආධුනිකයන්ට  ප්‍රවේශය ලබා දේ, එය දත්ත තුළ ඇති ගුණාංග අතර සියලු වැදගත් අන්තර් සබඳතා හඳුනා ගැනීම සඳහා උත්සාහයක් ලබා දේ.
  • මෙම ගොනු මණ්ඩලය, වෙකා තුළ පොකුරු ගත කිරීමේ ක්‍රම වලට ප්‍රවේශය ලබා දේ, උදාහරණය:- සරල k-means ඇල්ගොරිතම. ඒ වගේම මෙහි මිශ්‍රණයක් ඉගෙනීමෙහි සාමාන්‍ය බෙදාහැරීම් සඳහා අපේක්ෂාව උපරිමායනය ඇල්ගොරිතමයන්හි ක්‍රියාත්මක කිරීමක් ඇත.
  • මෙම තේරීම් ගුණාංග මණ්ඩලය දත්ත සමුදාය තුළ වඩාත් අනාවැකි ගුණාංග හඳුනා ගැනීම සඳහා ඇල්ගොරිතම සපයයි.
  • මෙම දෘශ්‍යකරණ කමිටුව  විසිරණය ලකුණු කරන අනුකෘතිය පෙන්වයි. එය තනි විසිරණය ලකුණු තෙරීම සහ විශාල කිරීම කළ හැක.තවද එය විවිධ තේරීම් ක්‍රියකරුවන් භාවිතා කරමින්  තවදුරටත් විශ්ලේෂණය කළ හැක.  

දීර්ඝ පැකේජ

[සංස්කරණය]

3.7.2 සංස්කරණය තුළ (වෙකාහි  ස්ථාවර "පොත" අනුවාදයෙන් මෙසේ ලබා ගත නොහැක.), ඇසුරුම් කළමනාකරුවකු දීර්ඝ පැකේජයන්හි පහසු ස්ථාපනයට ඉඩ එක් කරන ලදී.[5] මෙම සංස්කරණය පෙර වෙකා සමග ඇතුළත් සමහර ක්‍රියකරිත්වයන් භාවිතා කළ බැවින් එවැනි දීර්ඝ ඇසුරුම් මාරු කර ඇත. ඒ වගේම මෙම වෙනසද අනෙක් අයගේ පහසුව සදහා වෙකාහි දීර්ඝ  කිරීමට  දායකත්වය සහ මෘදුකාංග නඩත්තු කිරීමට යොදා ගනී.මෙම නිර්මාණ ශිල්පය  පරිදි වෙකා හරයන්හි ස්වාධීන  නවීකරණයන් සහ තනි තනි දීර්ඝ කිරීම් වලට ඉඩ ලබා දෙයි.  

ඉතිහාසය

[සංස්කරණය]
  • වර්ෂ 1993 දී, නවසීලන්තයේ Waikato විශ්ව විද්‍යාලය, වෙකාහි මුල් අනුවාදය සංවර්ධනය ආරම්භ කරන ලදී.එය Tcl / Tk, C, සහ Makefiles වල මිශ්‍රණයක් බවට පත් විය.
  • වර්ෂ 1997 දී, ඉතා හොඳ ජවා මගින් වෙකා නැවත සංවර්ධනය කිරීමට තීරණය කරන ලදී.මෙහිදී ආකෘති නිර්මාණයන්හි ඇල්ගොරිතම නිර්මාණයන් ඇතුළත් කරන ලදී.[6]
  • 2005 දී, වෙකා සදහා SIGKDD දත්ත පතල් හා දැනුම සොයාගැනීම සේවා සම්මානයෙන් පිදුම් ලැබන ලදී.[7][8]
  • වර්ෂ 2006 දී, Pentaho සංස්ථාව  ව්‍යාපාර බුද්ධිය සදහා වෙකා භාවිතා කිරීමට සම්පූර්ණ බලපත්‍රයක් ලබා ගන්නා ලදී. .එය Pentaho ව්‍යාපාර බුද්ධි කට්ටලයෙහි දත්ත පතල් හා අනාවැකි විශ්ලේෂණ සංරචක ආකෘති සාදයි.
  • 2011-08-26 වන විට Sourceforge.net  හි සියලුම කාල ශ්‍රේණි ගතකිරීම් 243 ක් වේ. (2,487,213 ක් බාගත කිරීම් සමග)

සම්බන්ධ මෙවලම්

[සංස්කරණය]
  •  ELKI (Environment for DeveLoping KDD-Applications Supported by Index-Structures) යනු පොකුරු විශ්ලේෂණය  සමග කේන්ද්‍රික වු වෙකාට සමාන ව්‍යාපෘතියක් වේ.එය අධීක්ෂණයක් නැති ක්‍රමයක් වේ.
  • KNIME යනු ජාවා මගින් ක්‍රියත්මක වන යාන්ත්‍රික ඉගෙනුම් සහ දත්ත කැණීම් මෘදුකාංග වේ.
  • Massive Online Analysis (MOA) යනු  දත්ත ප්‍රවාහයන්හි වීශාල ප්‍රමාණයේ කැණීම් සදහා විවෘත මුලාශ්‍ර ව්‍යාපෘතියක් වේ.එය නවසීලන්තයේ Waikato විශ්ව විද්‍යාලයේ සංවර්ධනය කරන ලදී.
  • ස්නායුක නිර්මාණකරුවා  යනු  C++ වලින් ලියු ගැඹුරු ඉගෙනුම් ක්‍රම මත පදනම් වු දත්ත කැණීම් මෘදුකාංගයකි.
  • Orange යනු  Python සහ C++ වලින් ලියු දත්ත කැණීම්,යාන්ත්‍රික ඉගෙනුම සහ දෘශ්යමය සදහා සමාන විවෘත මුලාශ්‍ර ව්‍යාපෘතියක් වේ. 
  • RapidMiner යනු වෙකා ඒකාබද්ධ කරන ජාවා තුළ ක්‍රියත්මක වන වාණිජ යාන්ත්‍රික ඉගෙනුම්  රමුවකි.

අමතර කියවීම්

[සංස්කරණය]
  • යාන්ත්‍රික ඉගෙනුම
  • දත්ත කැණීම
  • සංඛ්‍යාත්මක විශ්ලේෂණයේ මෘදුකාංග ලැයිස්තුව

ආශ්‍රිත ලිපි

[සංස්කරණය]
  1. ^ Ian H. Witten; Eibe Frank; Mark A. Hall (2011). "Data Mining: Practical machine learning tools and techniques, 3rd Edition". Morgan Kaufmann, San Francisco. සම්ප්‍රවේශය 2011-01-19.
  2. ^ G. Holmes; A. Donkin; I.H. Witten (1994). "Weka: A machine learning workbench" (PDF). Proc Second Australia and New Zealand Conference on Intelligent Information Systems, Brisbane, Australia. සම්ප්‍රවේශය 2007-06-25.
  3. ^ S.R. Garner; S.J. Cunningham; G. Holmes; C.G. Nevill-Manning; I.H. Witten (1995). "Applying a machine learning workbench: Experience with agricultural databases" (PDF). Proc Machine Learning in Practice Workshop, Machine Learning Conference, Tahoe City, CA, USA. pp. 14–21. සම්ප්‍රවේශය 2007-06-25.
  4. ^ P. Reutemann; B. Pfahringer; E. Frank (2004). "Proper: A Toolbox for Learning from Relational Data with Propositional and Multi-Instance Learners". 17th Australian Joint Conference on Artificial Intelligence (AI2004). Springer-Verlag. සම්ප්‍රවේශය 2007-06-25.
  5. ^ "weka - How do I use the package manager?". සම්ප්‍රවේශය 20 September 2014.
  6. ^ Ian H. Witten; Eibe Frank; Len Trigg; Mark Hall; Geoffrey Holmes; Sally Jo Cunningham (1999). "Weka: Practical Machine Learning Tools and Techniques with Java Implementations" (PDF). Proceedings of the ICONIP/ANZIIS/ANNES'99 Workshop on Emerging Knowledge Engineering and Connectionist-Based Information Systems. pp. 192–196. සම්ප්‍රවේශය 2007-06-26.
  7. ^ Gregory Piatetsky-Shapiro (2005-06-28). "KDnuggets news on SIGKDD Service Award 2005". සම්ප්‍රවේශය 2007-06-25.
  8. ^ "Overview of SIGKDD Service Award winners". 2005. සම්ප්‍රවේශය 2007-06-25.

බාහිර සම්බන්ධතා

[සංස්කරණය]