Articles of एनएलपी

एनएलटीके / पायथन में मूवी रिव्यू कार्पस का वर्गीकरण

मैं एनएलटीके अध्याय 6 की नस में कुछ वर्गीकरण करना चाहता हूं। पुस्तकें श्रेणियों को बनाने में एक कदम को छोड़ने लगता है, और मुझे यकीन नहीं है कि मैं क्या गलत कर रहा हूं। मैं अपनी स्क्रिप्ट यहाँ निम्नलिखित प्रतिक्रिया के साथ है मेरी समस्याएं प्राथमिक रूप से प्रथम भाग से जुड़ी होती हैं […]

जावा में फजी स्ट्रिंग सर्च लाइब्रेरी

मैं फजी स्ट्रिंग खोज के लिए एक उच्च प्रदर्शन जावा लाइब्रेरी की तलाश कर रहा हूं। समान स्ट्रिंग्स, लेवेनशटेन दूरी, दाईच-मोकोटॉफ साउंडएक्स, एन-ग्राम इत्यादि खोजने के लिए कई एल्गोरिदम हैं। क्या जावा कार्यान्वयन मौजूद है? उनके लिए पेशेवरों और विपक्ष? मैं लुसेन से अवगत हूं, कोई अन्य समाधान या ल्यूसीन सबसे अच्छा है? मैंने ये […]

एक शब्द में सिलेबल्स का पता लगा रहा है

मुझे एक शब्द में सिलेबल्स का पता लगाने का एक बहुत ही कुशल तरीका खोजने की आवश्यकता है I उदाहरण के लिए, अदृश्य -> ​​इन-वी-सिब-ले कुछ सिलेबेशन नियम हैं जिनका उपयोग किया जा सकता है: वी सीवी वीसी सीवीसी सीसीवी सीसीसीवी सीवीसीसी * जहां वी एक स्वर है और सी एक व्यंजक है उदाहरण के […]

मैं कई जुड़ने वाले शब्दों को कैसे विभाजित कर सकता हूं?

मेरे पास 1000 या तो प्रविष्टियों की एक सरणी है, नीचे दिए गए उदाहरणों के साथ: wickedweather liquidweather driveourtrucks gocompact slimprojector मैं इन्हें अपने संबंधित शब्दों में विभाजित करने में सक्षम होना चाहता हूं, जैसे: wicked weather liquid weather drive our trucks go compact slim projector मैं एक नियमित अभिव्यक्ति की उम्मीद कर रहा था […]

एनएलटीके से रोकथाम हटाने

मैं nltk टूलकिट का उपयोग कर स्टॉफ़्टर्स को निकालकर पाठ में प्रवेश करने के लिए एक उपयोगकर्ता को संसाधित करने का प्रयास कर रहा हूं, लेकिन स्टॉपवर्ड निकालने से 'और', 'या', 'नहीं' जैसी शब्द निकाल दिए गए हैं मैं इन शब्दों को स्टॉपडॉग हटाने की प्रक्रिया के बाद उपस्थित होना चाहता हूं क्योंकि वे ऑपरेटर […]

कोड गोल्फ: शब्दों की संख्या

कोड गोल्फ श्रृंखला काफी लोकप्रिय लगती है। मैंने कुछ कोड में भाग लिया जो किसी संख्या को उसके शब्द प्रतिनिधित्व में बदल देती है कुछ उदाहरण (प्रोग्रामिंग मज़ा के लिए 2 की शक्तियां) होंगे: 2 -> दो 1024 -> एक हजार चौबीसों 1048576 -> एक लाख चालीस आठ हजार पांच सौ सत्तर छ: एल्गोरिदम मेरे […]

कैसे 2 गणना तार दिया कोसाइन समानता की गणना करने के लिए? – पायथन

अजगर से: टीएफ- आईडीएफ-कोसाइन: दस्तावेज़ समानता प्राप्त करने के लिए , टीएफ-आईडीएफ कोसाइन का उपयोग करके दस्तावेज़ समानता की गणना करना संभव है। बाहरी पुस्तकालयों को आयात किए बिना, क्या दो तारों के बीच कोसाइन समानता की गणना करने के लिए कोई भी तरीका है? s1 = "This is a foo bar sentence ." s2 […]

क्या कोई अच्छी प्राकृतिक भाषा प्रसंस्करण पुस्तकालय है

मुझे अपने मौजूदा मॉड्यूल में कुछ एनएलपी लागू करना होगा। मैं कुछ अच्छी लाइब्रेरी देख रहा हूं जो मेरी मदद कर सकता है मैं 'लिंगपेप' के पास आया था, लेकिन इसका उपयोग कैसे किया जाए इसका पूरी तरह से पालन नहीं किया जा सका। असल में, हमें एक ऐसी सुविधा को कार्यान्वित करने की आवश्यकता […]

एनएलटीके के साथ एक नया कॉर्पस बनाना

मुझे लगता है कि अक्सर मेरे शीर्षक का जवाब जाना और दस्तावेजों को पढ़ना है, लेकिन मैं एनएलटीके की पुस्तक के माध्यम से भाग गया लेकिन यह जवाब नहीं देता है। मैं अजगर के लिए नया हूँ मेरे पास .txt फ़ाइलों का एक गुच्छा है और मैं कॉर्पस फ़ंक्शंस का उपयोग करने में सक्षम होना […]

Google "आपका क्या मतलब है?" एल्गोरिदम का काम है?

मैं पोर्टफोलियो प्रबंधन उपकरण के लिए एक आंतरिक वेबसाइट विकसित कर रहा हूं। बहुत सारे पाठ डेटा, कंपनी के नाम आदि हैं। कुछ खोज इंजनों से वास्तव में प्रभावित हुए हैं, "क्या आपका मतलब था: XXXX" के साथ बहुत जल्दी प्रश्नों का उत्तर देने की क्षमता है। मुझे समझदारी से एक उपयोगकर्ता क्वेरी लेनी चाहिए […]

दिलचस्प पोस्ट
एसक्यूएल सर्वर: पायथन स्ट्रिंग डेटा के उदाहरण कुंजी स्पार्क द्वारा एक से अधिक आउटपुट लिखें – एक स्पार्क जॉब सी # में विशिष्ट समय पर, एक विधि को दैनिक कैसे कॉल करें? जावा में स्थिर कक्षाएं जावास्क्रिप्ट सरणी में निहित सबसे बड़ी संख्या मैं कैसे पा सकता हूं? किसी सूची में संख्याओं की संचयी संख्या कैसे प्राप्त करें? ASP.NET MVC में डिफ़ॉल्ट सत्यापन त्रुटि संदेश कैसे परिवर्तित करें? टैबकॉन्ट्रॉल से टैबपेज को कैसे छिपाएंगे PHP में कॉल करने वाले पायथन कौन सा एल्गोरिथ्म का इस्तेमाल विभिन्न रूपों के आयतों को छोटे आकार में संभवतः इष्टतम तरीके से संभव बनाने में किया जा सकता है? मनोविज्ञानी गहराई पर मोंगोडीबी फील्ड नाम कैसे खोजें क्या पुनर्प्राप्ति विधि को 'रिक्त' वापस करना चाहिए या अपवाद फेंकता है, जब वह वापसी मूल्य का उत्पादन नहीं कर सकता है? बिटबाकेट को धक्का जाने के बाद एटलसियन "लोगो" यूआरएल एन्कोडिंग स्पेस वर्ण: + या% 20? इकाई परीक्षण शून्य तरीकों?