Անվանված սուբյեկտների ճանաչումը տեղեկատվության արդյունահանման ենթաառաջադրանք է, որը ձգտում է գտնել և դասակարգել չկառուցված տեքստում նշված անվանված սուբյեկտները նախապես սահմանված կատեգորիաների, ինչպիսիք են անձանց անունները, կազմակերպությունները, վայրերը, բժշկական ծածկագրերը, ժամանակային արտահայտությունները, քանակները, դրամական միջոցները: արժեքներ, տոկոսներ և այլն:
Ի՞նչ է անում անվանված կազմակերպության ճանաչումը:
Անվանված սուբյեկտների ճանաչումը բնական լեզվի մշակման տեխնիկա է, որը կարող է ավտոմատ կերպով սկանավորել ամբողջ հոդվածները և տեքստից հանել որոշ հիմնարար սուբյեկտներ և դասակարգել դրանք նախապես սահմանված կատեգորիաների:
Ի՞նչ է կոչվում սուբյեկտի ճանաչումը բացատրել օրինակների օգնությամբ:
Անվանված կազմակերպությունների ճանաչումը (NER) օգնում է հեշտությամբ բացահայտել տեքստի հիմնական տարրերը, ինչպիսիք են մարդկանց անունները, վայրերը, ապրանքանիշերը, դրամական արժեքները և այլն: Տեքստում հիմնական սուբյեկտների դուրսբերումը օգնում է տեսակավորել չկառուցված տվյալները և հայտնաբերել կարևոր տեղեկատվություն, ինչը կարևոր է, եթե դուք գործ ունեք տվյալների մեծ հավաքածուների հետ:
Որտե՞ղ է օգտագործվում անվանված կազմակերպության ճանաչումը:
Անվանված կազմակերպությունների ճանաչումը կարող է ավտոմատ կերպով սկանավորել ամբողջ հոդվածները և բացահայտել, թե որոնք են դրանցում քննարկված հիմնական մարդիկ, կազմակերպություններ և վայրեր: Յուրաքանչյուր հոդվածի համապատասխան պիտակների իմացությունը օգնում է հոդվածները ավտոմատ կերպով դասակարգել սահմանված հիերարխիաներում և հնարավորություն է տալիս սահուն բովանդակության հայտնաբերում:
Ինչպե՞ս եք ստեղծում անվանակոչված կազմակերպության ճանաչում:
- Ավելացրեք կազմակերպության նոր պիտակըճանաչիչ՝ օգտագործելով add_label մեթոդը։
- Շրջեք օրինակները և զանգահարեք nlp: թարմացում, որն անցնում է մուտքագրման բառերի միջով: Յուրաքանչյուր բառի վրա այն կանխատեսում է անում: …
- Պահեք վերապատրաստված մոդելը՝ օգտագործելով nlp: to_disk.
- Փորձեք մոդելը՝ համոզվելու համար, որ նոր կազմը ճիշտ է ճանաչվել։