முக்கிய உள்ளடக்கத்திற்கு தாவு

அடிக்கடி கேட்கப்படும் கேள்விகள்

எனது சோதனைகள் மிகவும் மெதுவாக உள்ளன

நீங்கள் இந்த @wdio/ocr-service ஐப் பயன்படுத்தும்போது, உங்கள் சோதனைகளை வேகப்படுத்த அதைப் பயன்படுத்தவில்லை, உங்கள் வலை/மொபைல் பயன்பாட்டில் கூறுகளைக் கண்டறிவதில் சிரமம் உள்ளது, மேலும் அவற்றைக் கண்டறிய எளிதான வழியை நீங்கள் விரும்புகிறீர்கள். மேலும் நீங்கள் ஏதாவது விரும்பும்போது, வேறொன்றை இழக்கிறீர்கள் என்பதை நாம் அனைவரும் நம்புகிறோம். ஆனால்...., @wdio/ocr-service ஐ வழக்கமான விகிதத்தை விட வேகமாக செயல்படுத்த ஒரு வழி உள்ளது. அதைப் பற்றிய கூடுதல் தகவல்களை இங்கே காணலாம்.

இந்த சேவையின் கட்டளைகளை இயல்புநிலை WebdriverIO கட்டளைகள்/தேர்வுக்கருவிகளுடன் பயன்படுத்த முடியுமா?

ஆம், நீங்கள் உங்கள் ஸ்கிரிப்டை இன்னும் சக்திவாய்ந்ததாக்க கட்டளைகளை இணைக்கலாம்! முடிந்தவரை இயல்புநிலை WebdriverIO கட்டளைகள்/தேர்வுக்கருவிகளைப் பயன்படுத்துவது மற்றும் தனிப்பட்ட தேர்வுக்கருவியைக் கண்டுபிடிக்க முடியாதபோது அல்லது உங்கள் தேர்வுக்கருவி மிகவும் எளிதில் உடையக்கூடியதாக மாறும்போது மட்டுமே இந்த சேவையைப் பயன்படுத்துவது ஆலோசனை ஆகும்.

எனது உரை கண்டுபிடிக்கப்படவில்லை, எப்படி அது சாத்தியம்?

முதலில், இந்த மாட்யூலில் OCR செயல்முறை எவ்வாறு செயல்படுகிறது என்பதைப் புரிந்துகொள்வது முக்கியம், எனவே இந்த பக்கத்தைப் படிக்கவும். உங்கள் உரையை இன்னும் கண்டுபிடிக்க முடியவில்லை என்றால், நீங்கள் பின்வரும் விஷயங்களை முயற்சிக்கலாம்.

படப் பகுதி மிகப் பெரியதாக உள்ளது

மாட்யூல் திரைப்பிடிப்பின் பெரிய பகுதியைச் செயலாக்க வேண்டியிருக்கும்போது, அது உரையைக் கண்டுபிடிக்காமல் போகலாம். நீங்கள் கட்டளையை பயன்படுத்தும்போது ஒரு haystack வழங்குவதன் மூலம் ஒரு சிறிய பகுதியை வழங்கலாம். haystack வழங்குவதை ஆதரிக்கும் கட்டளைகள் எவை என்பதைச் சரிபார்க்கவும்.

உரை மற்றும் பின்னணிக்கு இடையேயான வேறுபாடு சரியாக இல்லை

இதன் பொருள் வெள்ளை பின்னணியில் வெளிர் உரை அல்லது இருண்ட பின்னணியில் இருண்ட உரை இருக்கலாம். இது உரையைக் கண்டுபிடிக்க முடியாமல் போகலாம். கீழே உள்ள எடுத்துக்காட்டுகளில், Why WebdriverIO? உரை வெள்ளையாக இருப்பதையும், சாம்பல் நிற பொத்தானால் சூழப்பட்டிருப்பதையும் நீங்கள் காணலாம். இந்த வழக்கில், Why WebdriverIO? உரையைக் கண்டுபிடிக்க முடியாது. குறிப்பிட்ட கட்டளைக்கான வேறுபாட்டை அதிகரிப்பதன் மூலம் அது உரையைக் கண்டுபிடித்து அதைக் கிளிக் செய்ய முடியும், இரண்டாவது படத்தைப் பார்க்கவும்.

await driver.ocrClickOnText({
haystack: { height: 44, width: 1108, x: 129, y: 590 },
text: "WebdriverIO?",
// // With the default contrast of 0.25, the text is not found
contrast: 1,
});

Contrast issues

ஏன் எனது உறுப்பு கிளிக் செய்யப்படுகிறது ஆனால் என் மொபைல் சாதனங்களில் கீபோர்ட் தோன்றவில்லை?

கிளிக் நீண்ட நேரம் நீடிக்கும் மற்றும் நீண்ட நேர தட்டலாகக் கருதப்படும் சில உரை புலங்களில் இது நிகழலாம். இதைத் தவிர்க்க ocrClickOnText மற்றும் ocrSetValue இல் clickDuration விருப்பத்தைப் பயன்படுத்தலாம். இங்கே பார்க்கவும்.

WebdriverIO வழக்கமாகச் செய்யக்கூடிய பல உறுப்புகளை இந்த மாட்யூல் திருப்பித் தர முடியுமா?

இல்லை, இது தற்போது சாத்தியமில்லை. மாட்யூல் வழங்கப்பட்ட தேர்வுக்கருவியுடன் பொருந்தும் பல உறுப்புகளைக் கண்டால், அது தானாகவே அதிகபட்ச பொருத்த மதிப்பெண்ணைக் கொண்ட உறுப்பைக் கண்டறியும்.

இந்த சேவையால் வழங்கப்படும் OCR கட்டளைகள் மூலம் எனது பயன்பாட்டை முழுமையாக தானியங்குபடுத்த முடியுமா?

நான் இதுவரை செய்ததில்லை, ஆனால் கோட்பாட்டளவில், அது சாத்தியமாக இருக்க வேண்டும். நீங்கள் அதில் வெற்றிபெற்றால் எங்களுக்குத் தெரியப்படுத்தவும் ☺️.

{languageCode}.traineddata என்ற கூடுதல் கோப்பு சேர்க்கப்பட்டுள்ளதை நான் காண்கிறேன், இது என்ன?

{languageCode}.traineddata என்பது Tesseract ஆல் பயன்படுத்தப்படும் மொழி தரவு கோப்பாகும். இது தேர்ந்தெடுக்கப்பட்ட மொழிக்கான பயிற்சி தரவைக் கொண்டுள்ளது, இது ஆங்கில எழுத்துகள் மற்றும் சொற்களை திறம்பட அங்கீகரிக்க Tesseract க்கு தேவையான தகவல்களை உள்ளடக்கியது.

{languageCode}.traineddata இன் உள்ளடக்கம்

கோப்பு பொதுவாக பின்வருவனவற்றைக் கொண்டுள்ளது:

  1. எழுத்து தொகுப்பு தரவு: ஆங்கில மொழியில் உள்ள எழுத்துக்களைப் பற்றிய தகவல்.
  2. மொழி மாடல்: எழுத்துகள் சொற்களை உருவாக்கும் விதம் மற்றும் சொற்கள் வாக்கியங்களை உருவாக்கும் விதம் பற்றிய புள்ளியியல் மாடல்.
  3. அம்ச பிரித்தெடுப்பான்கள்: எழுத்துகளை அங்கீகரிப்பதற்காக படங்களிலிருந்து அம்சங்களை எவ்வாறு பிரித்தெடுப்பது என்பது பற்றிய தரவு.
  4. பயிற்சி தரவு: பெரிய அளவிலான ஆங்கில உரை படங்களில் Tesseract ஐப் பயிற்றுவிப்பதிலிருந்து பெறப்பட்ட தரவு.

{languageCode}.traineddata ஏன் முக்கியமானது?

  1. மொழி அங்கீகாரம்: ஒரு குறிப்பிட்ட மொழியில் உரையை துல்லியமாக அங்கீகரித்து செயலாக்க Tesseract இந்த பயிற்சி தரவு கோப்புகளை நம்பியுள்ளது. {languageCode}.traineddata இல்லாமல், Tesseract ஆங்கில உரையை அங்கீகரிக்க முடியாது.
  2. செயல்திறன்: OCR இன் தரம் மற்றும் துல்லியம் பயிற்சி தரவின் தரத்துடன் நேரடியாக தொடர்புடையது. சரியான பயிற்சி தரவு கோப்பைப் பயன்படுத்துவது OCR செயல்முறை முடிந்தவரை துல்லியமாக இருப்பதை உறுதி செய்கிறது.
  3. இணக்கத்தன்மை: உங்கள் திட்டத்தில் {languageCode}.traineddata கோப்பை சேர்ப்பது வெவ்வேறு அமைப்புகள் அல்லது குழு உறுப்பினர்களின் கணினிகளில் OCR சூழலை மறுபடியும் உருவாக்குவதை எளிதாக்குகிறது.

{languageCode}.traineddata இன் பதிப்புகள்

பின்வரும் காரணங்களுக்காக {languageCode}.traineddata ஐ உங்கள் பதிப்பு கட்டுப்பாட்டு அமைப்பில் சேர்ப்பது பரிந்துரைக்கப்படுகிறது:

  1. நிலைத்தன்மை: இது அனைத்து குழு உறுப்பினர்கள் அல்லது டெப்லாய்மென்ட் சூழல்கள் அதே பதிப்பிலான பயிற்சி தரவைப் பயன்படுத்துவதை உறுதி செய்கிறது, இது வெவ்வேறு சூழல்களில் நிலையான OCR முடிவுகளை வழங்குகிறது.
  2. மறுஉருவாக்கம்: இந்த கோப்பை பதிப்பு கட்டுப்பாட்டில் சேமிப்பது பின்னர் அல்லது வேறு கணினியில் OCR செயல்முறையை இயக்கும்போது முடிவுகளை மீண்டும் உருவாக்குவதை எளிதாக்குகிறது.
  3. சார்புகள் நிர்வாகம்: அதை பதிப்பு கட்டுப்பாட்டு அமைப்பில் சேர்ப்பது சார்புகளை நிர்வகிப்பதில் உதவுகிறது மற்றும் எந்த அமைப்பு அல்லது சூழல் கட்டமைப்பும் திட்டத்தை சரியாக இயக்குவதற்கு தேவையான கோப்புகளை உள்ளடக்கியுள்ளது என்பதை உறுதி செய்கிறது.

சோதனை ஓட்டாமல் என் திரையில் எந்த உரை கண்டுபிடிக்கப்படுகிறது என்பதைப் பார்க்க எளிதான வழி உள்ளதா?

ஆம், அதற்காக நீங்கள் எங்கள் CLI wizard ஐப் பயன்படுத்தலாம். ஆவணங்களை இங்கே காணலாம்

Welcome! How can I help?

WebdriverIO AI Copilot