Semalt Inasanifisha Kwenye URLitor - Chombo cha Wavuti cha Wavuti Kizuri sana & Chombo cha uchimbaji wa data

URLitor ni kifaa kipya lakini kinachofaa cha chakavu cha wavuti na zana ya uchotaji data. Kutumia URLitor, unahitaji tu kuongeza orodha ya URL zote ambazo unataka kuipaka mkondoni kwenye templeti iliyotolewa. Kisha unahitaji kutaja kipengee cha HTML unachotaka kuondoa kutoka kwenye kurasa za wavuti na bonyeza kitufe cha kuwasilisha. Ni rahisi kama hiyo. Ukiwa na zana hii, hauitaji kutengeneza nakala au kubandika kutoka kwa kivinjari tena.
xPath ni lugha ambayo hutumiwa kutafuta habari katika faili za XML. Inatumia misemo fulani kuchagua nodi-seti au nodi katika faili za XML. Maneno ambayo XPath anaelewa ni sawa na yale ambayo hutumiwa na faili za kawaida za kompyuta au hati.

Ingawa XPath inatumiwa na lugha kadhaa za programu, zana hii imejengwa kwa watumiaji ambao hawana ujuzi wowote wa programu. Kwa hivyo, hauitaji kuwa programu ya kutengeneza. Ukiwa na zana hii, unaweza kutoa data kutoka kwa kurasa kadhaa za HTML na XML.
Kwa unyenyekevu wa matumizi, maneno kadhaa ya XPath yaliyotumiwa mara nyingi yameorodheshwa kuwa menyu ya kushuka ili watumiaji watahitaji kuchagua yoyote kati yao kulingana na lengo lao. Walakini, watumiaji wenye uzoefu wa XPath wana uhuru wa kutumia misemo yao wakati wowote wanapotaka.
Chombo hicho kimetengenezwa kwa uwezo wa URL 100 kwenye kikao kimoja cha chakavu, na inachukua maneno 10 kwa wakati mmoja. Kwa maneno mengine, inaweza kutafuta data kutoka kwa upeo wa URL 100 kwa wakati mmoja.
Baadhi ya maneno muhimu ya XPath maalum ambayo yanaweza kubadilishwa au kuongezwa yameainishwa hapa chini:
1. // div [2] - Maneno haya huchagua kidato cha pili kwa hiari ya kifalme;
2. // link [@ rel = 'canonical'] / @ href - Maneno haya huchagua eneo (Ref) la tepe ambalo hutumika kuweka sifa ya uhusiano sawa na halali;
3. / html / head / meta [@ jina = 'maelezo'] / @ yaliyomo - Usemi huu hutumiwa kwa kuchagua yaliyomo;
4. // * [@ class = 'class-name'] - Unaweza kutumia usemi huu kuchagua vitu vyote vilivyo na "darasa la jina" kama darasa la CSS;
5. // h2 | // kichwa - usemi huu unaweza kutumika kuchagua H2 ya kwanza na kichwa cha ukurasa;
6. // * [jina () = 'h1' au jina () = 'kichwa'] - Matamshi haya yanafanya kazi sawa na ile iliyo hapo juu. Walakini, usemi uliyotolewa hapo juu ni bora kwani ni mfupi;
7. // * [ina (@class, 'thumb')] - Maneno haya huchagua kila kitu ambacho kina darasa la CSS na pia ina 'thumb' ya kutolewa;
8. // mzazi :: * [maandishi () = 'Karibu'] - Msemo huu huchagua mzazi wa kitu chochote kilicho na maandishi 'Karibu';
Chombo hiki ni toleo la Beta na bado inaweza kufanya kazi na makosa kadhaa. Walakini, bado ni zana nzuri kwa watumiaji walio na ujuzi mdogo au hakuna programu kwani maneno yote yanayotumiwa mara nyingi yamefafanuliwa kuwa menyu kama ilivyotajwa mapema.