पायथन में जेनसिम क्या है?
पायथन में जेनसिम क्या है?

वीडियो: पायथन में जेनसिम क्या है?

वीडियो: पायथन में जेनसिम क्या है?
वीडियो: शुरुआती लोगों के लिए पायथन में जेनसिम की व्याख्या | मशीन लर्निंग सीखें 2024, नवंबर
Anonim

जेन्सिम आधुनिक सांख्यिकीय मशीन लर्निंग का उपयोग करते हुए, असुरक्षित विषय मॉडलिंग और प्राकृतिक भाषा प्रसंस्करण के लिए एक ओपन-सोर्स लाइब्रेरी है। जेन्सिम में लागू किया गया है अजगर और साइथन।

इसे ध्यान में रखते हुए Gensim Word2Vec क्या है?

1. का परिचय Word2vec . Word2vec दो-परत तंत्रिका नेटवर्क का उपयोग करके शब्द एम्बेडिंग सीखने की सबसे लोकप्रिय तकनीक में से एक है। इसका इनपुट एक टेक्स्ट कॉर्पस है और इसका आउटपुट वैक्टर का एक सेट है। इसके लिए दो मुख्य प्रशिक्षण एल्गोरिदम हैं वर्ड2vec , एक शब्द का निरंतर थैला (CBOW) है, दूसरे को स्किप-ग्राम कहा जाता है।

इसके अतिरिक्त, Gensim संक्षेपण कैसे कार्य करता है? ट्यूटोरियल: स्वचालित संक्षिप्तीकरण का उपयोग करते हुए जेन्सिम . यह मॉड्यूल टेक्स्ट से एक या अधिक महत्वपूर्ण वाक्यों को निकालकर, स्वचालित रूप से दिए गए टेक्स्ट को सारांशित करता है। इसी प्रकार, यह कर सकते हैं कीवर्ड भी निकालें।

इसके बाद, कोई यह भी पूछ सकता है कि मैं गेंसिम को पायथन में कैसे आयात करूं?

5 उत्तर। पहले आपको NumPy फिर SciPy और फिर स्थापित करने की आवश्यकता है जेन्सिम (यह मानते हुए कि आपके पास पहले से है अजगर स्थापित)। मैंनें इस्तेमाल किया अजगर 3.4 जैसा कि मुझे संस्करण 3.4 का उपयोग करके SciPy को स्थापित करना आसान लगता है। नोट: सुनिश्चित करें कि पाइप आपके पर्यावरण चर में है (अपने पर्यावरण चर में C:python34scripts जोड़ें)।

जेनसिम कॉर्पस क्या है?

अगली महत्वपूर्ण वस्तु जिसे आपको काम करने के लिए परिचित करने की आवश्यकता है जेन्सिम है कोर्पस (शब्दों का एक थैला)। यानी यह एक है कोष ऑब्जेक्ट जिसमें प्रत्येक दस्तावेज़ में शब्द आईडी और उसकी आवृत्ति शामिल है। आप इसके बारे में सोच सकते हैं जेन्सिम का दस्तावेज़-टर्म मैट्रिक्स के बराबर।

सिफारिश की: