அடிக்கடி கேட்கப்படும் கேள்விகள்
எனது சோதனைகள் மிகவும் மெதுவாக உள்ளன
நீங்கள் இந்த @wdio/ocr-service
ஐப் பயன்படுத்தும்போது, உங்கள் சோதனைகளை வேகப்படுத்த அதைப் பயன்படுத்தவில்லை, உங்கள் வலை/மொபைல் பயன்பாட்டில் கூறுகளைக் கண்டறிவதில் சிரமம் உள்ளது, மேலும் அவற்றைக் கண்டறிய எளிதான வழியை நீங்கள் விரும்புகிறீர்கள். மேலும் நீங்கள் ஏதாவது விரும்பும்போது, வேறொன்றை இழக்கிறீர்கள் என்பதை நாம் அனைவரும் நம்புகிறோம். ஆனால்...., @wdio/ocr-service
ஐ வழக்கமான விகிதத்தை விட வேகமாக செயல்படுத்த ஒரு வழி உள்ளது. அதைப் பற்றிய கூடுதல் தகவல்களை இங்கே காணலாம்.
இந்த சேவையின் கட்டளைகளை இயல்புநிலை WebdriverIO கட்டளைகள்/தேர்வுக்கருவிகளுடன் பயன்படுத்த முடியுமா?
ஆம், நீங்கள் உங்கள் ஸ்கிரிப்டை இன்னும் சக்திவாய்ந்ததாக்க கட்டளைகளை இணைக்கலாம்! முடிந்தவரை இயல்புநிலை WebdriverIO கட்டளைகள்/தேர்வுக்கருவிகளைப் பயன்படுத்துவது மற்றும் தனிப்பட்ட தேர்வுக்கருவியைக் கண்டுபிடிக்க முடியாதபோது அல்லது உங்கள் தேர்வுக்கருவி மிகவும் எளிதில் உடையக்கூடியதாக மாறும்போது மட்டுமே இந்த சேவையைப் பயன்படுத்துவது ஆலோசனை ஆகும்.
எனது உரை கண்டுபிடிக்கப்படவில்லை, எப்படி அது சாத்தியம்?
முதலில், இந்த மாட்யூலில் OCR செயல்முறை எவ்வாறு செயல்படுகிறது என்பதைப் புரிந்துகொள்வது முக்கியம், எனவே இந்த பக்கத்தைப் படிக்கவும். உங்கள் உரையை இன்னும் கண்டுபிடிக்க முடியவில்லை என்றால், நீங்கள் பின்வரும் விஷயங்களை முயற்சிக்கலாம்.
படப் பகுதி மிகப் பெரியதாக உள்ளது
மாட்யூல் திரைப்பிடிப்பின் பெரிய பகுதியைச் செயலாக்க வேண்டியிருக்கும்போது, அது உரையைக் கண்டுபிடிக்காமல் போகலாம். நீங்கள் கட்டளையை பயன்படுத்தும்போது ஒரு haystack வழங்குவதன் மூலம் ஒரு சிறிய பகுதியை வழங்கலாம். haystack வழங்குவதை ஆதரிக்கும் கட்டளைகள் எவை என்பதைச் சரிபார்க்கவும்.
உரை மற்றும் பின்னணிக்கு இடையேயான வேறுபாடு சரியாக இல்லை
இதன் பொருள் வெள்ளை பின்னணியில் வெளிர் உரை அல்லது இருண்ட பின்னணியில் இருண்ட உரை இருக்கலாம். இது உரையைக் கண்டுபிடிக்க முடியாமல் போகலாம். கீழே உள்ள எடுத்துக்காட்டுகளில், Why WebdriverIO?
உரை வெள்ளையாக இருப்பதையும், சாம்பல் நிற பொத்தானால் சூழப்பட்டிருப்பதையும் நீங்கள் காணலாம். இந்த வழக்கில், Why WebdriverIO?
உரையைக் கண்டுபிடிக்க முடியாது. குறிப்பிட்ட கட்டளைக்கான வேறுபாட்டை அதிகரிப்பதன் மூலம் அது உரையைக் கண்டுபிடித்து அதைக் கிளிக் செய்ய முடியும், இரண்டாவது படத்தைப் பார்க்கவும்.
await driver.ocrClickOnText({
haystack: { height: 44, width: 1108, x: 129, y: 590 },
text: "WebdriverIO?",
// // With the default contrast of 0.25, the text is not found
contrast: 1,
});
ஏன் எனது உறுப்பு கிளிக் செய்யப்படுகிறது ஆனால் என் மொபைல் சாதனங்களில் கீபோர்ட் தோன்றவில்லை?
கிளிக் நீண்ட நேரம் நீடிக்கும் மற்றும் நீண்ட நேர தட்டலாகக் கருதப்படும் சில உரை புலங்களில் இது நிகழலாம். இதைத் தவிர்க்க ocrClickOnText
மற்றும் ocrSetValue
இல் clickDuration
விருப்பத்தைப் பயன்படுத்தலாம். இங்கே பார்க்கவும்.
WebdriverIO வழக்கமாகச் செய்யக்கூடிய பல உறுப்புகளை இந்த மாட்யூல் திருப்பித் தர முடியுமா?
இல்லை, இது தற்போது சாத்தியமில்லை. மாட்யூல் வழங்கப்பட்ட தேர்வுக்கருவியுடன் பொருந்தும் பல உறுப்புகளைக் கண்டால், அது தானாகவே அதிகபட்ச பொருத்த மதிப்பெண்ணைக் கொண்ட உறுப்பைக் கண்டறியும்.
இந்த சேவையால் வழங்கப்படும் OCR கட்டளைகள் மூலம் எனது பயன்பாட்டை முழுமையாக தானியங்குபடுத்த முடியுமா?
நான் இதுவரை செய்ததில்லை, ஆனால் கோட்பாட்டளவில், அது சாத்தியமாக இருக்க வேண்டும். நீங்கள் அதில் வெற்றிபெற்றால் எங்களுக்குத் தெரியப்படுத்தவும் ☺️.
{languageCode}.traineddata
என்ற கூடுதல் கோப்பு சேர்க்கப்பட்டுள்ளதை நான் காண்கிறேன், இது என்ன?
{languageCode}.traineddata
என்பது Tesseract ஆல் பயன்படுத்தப்படும் மொழி தரவு கோப்பாகும். இது தேர்ந்தெடுக்கப்பட்ட மொழிக்கான பயிற்சி தரவைக் கொண்டுள்ளது, இது ஆங்கில எழுத்துகள் மற்றும் சொற்களை திறம்பட அங்கீகரிக்க Tesseract க்கு தேவையான தகவல்களை உள்ளடக்கியது.
{languageCode}.traineddata
இன் உள்ளடக்கம்
கோப்பு பொதுவாக பின்வருவனவற்றைக் கொண்டுள்ளது:
- எழுத்து தொகுப்பு தரவு: ஆங்கில மொழியில் உள்ள எழுத்துக்களைப் பற்றிய தகவல்.
- மொழி மாடல்: எழுத்துகள் சொற்களை உருவாக்கும் விதம் மற்றும் சொற்கள் வாக்கியங்களை உருவாக்கும் விதம் பற்றிய புள்ளியியல் மாடல்.
- அம்ச பிரித்தெடுப்பான்கள்: எழுத்துகளை அங்கீகரிப்பதற்காக படங்களிலிருந்து அம்சங்களை எவ்வாறு பிரித்தெடுப்பது என்பது பற்றிய தரவு.
- பயிற்சி தரவு: பெரிய அளவிலான ஆங்கில உரை படங்களில் Tesseract ஐப் பயிற்றுவிப்பதிலிருந்து பெறப்பட்ட தரவு.
{languageCode}.traineddata
ஏன் முக்கியமானது?
- மொழி அங்கீகாரம்: ஒரு குறிப்பிட்ட மொழியில் உரையை துல்லியமாக அங்கீகரித்து செயலாக்க Tesseract இந்த பயிற்சி தரவு கோப்புகளை நம்பியுள்ளது.
{languageCode}.traineddata
இல்லாமல், Tesseract ஆங்கில உரையை அங்கீகரிக்க முடியாது. - செயல்திறன்: OCR இன் தரம் மற்றும் துல்லியம் பயிற்சி தரவின் தரத்துடன் நேரடியாக தொடர்புடையது. சரியான பயிற்சி தரவு கோப்பைப் பயன்படுத்துவது OCR செயல்முறை முடிந்தவரை துல்லியமாக இருப்பதை உறுதி செய்கிறது.
- இணக்கத்தன்மை: உங்கள் திட்டத்தில்
{languageCode}.traineddata
கோப்பை சேர்ப்பது வெவ்வேறு அமைப்புகள் அல்லது குழு உறுப்பினர்களின் கணினிகளில் OCR சூழலை மறுபடியும் உருவாக்குவதை எளிதாக்குகிறது.
{languageCode}.traineddata
இன் பதிப்புகள்
பின்வரும் காரணங்களுக்காக {languageCode}.traineddata
ஐ உங்கள் பதிப்பு கட்டுப்பாட்டு அமைப்பில் சேர்ப்பது பரிந்துரைக்கப்படுகிறது:
- நிலைத்தன்மை: இது அனைத்து குழு உறுப்பினர்கள் அல்லது டெப்லாய்மென்ட் சூழல்கள் அதே பதிப்பிலான பயிற்சி தரவைப் பயன்படுத்துவதை உறுதி செய்கிறது, இது வெவ்வேறு சூழல்களில் நிலையான OCR முடிவுகளை வழங்குகிறது.
- மறுஉருவாக்கம்: இந்த கோப்பை பதிப்பு கட்டுப்பாட்டில் சேமிப்பது பின்னர் அல்லது வேறு கணினியில் OCR செயல்முறையை இயக்கும்போது முடிவுகளை மீண்டும் உருவாக்குவதை எளிதாக்குகிறது.
- சார்புகள் நிர்வாகம்: அதை பதிப்பு கட்டுப்பாட்டு அமைப்பில் சேர்ப்பது சார்புகளை நிர்வகிப்பதில் உதவுகிறது மற்றும் எந்த அமைப்பு அல்லது சூழல் கட்டமைப்பும் திட்டத்தை சரியாக இயக்குவதற்கு தேவையான கோப்புகளை உள்ளடக்கியுள்ளது என்பதை உறுதி செய்கிறது.
சோதனை ஓட்டாமல் என் திரையில் எந்த உரை கண்டுபிடிக்கப்படுகிறது என்பதைப் பார்க்க எளிதான வழி உள்ளதா?
ஆம், அதற்காக நீங்கள் எங்கள் CLI wizard ஐப் பயன்படுத்தலாம். ஆவணங்களை இங்கே காணலாம்