Անվանված սուբյեկտի ճանաչու՞մ:

Բովանդակություն:

Անվանված սուբյեկտի ճանաչու՞մ:
Անվանված սուբյեկտի ճանաչու՞մ:
Anonim

Անվանված սուբյեկտների ճանաչումը տեղեկատվության արդյունահանման ենթաառաջադրանք է, որը ձգտում է գտնել և դասակարգել չկառուցված տեքստում նշված անվանված սուբյեկտները նախապես սահմանված կատեգորիաների, ինչպիսիք են անձանց անունները, կազմակերպությունները, վայրերը, բժշկական ծածկագրերը, ժամանակային արտահայտությունները, քանակները, դրամական միջոցները: արժեքներ, տոկոսներ և այլն:

Ի՞նչ է անում անվանված կազմակերպության ճանաչումը:

Անվանված սուբյեկտների ճանաչումը բնական լեզվի մշակման տեխնիկա է, որը կարող է ավտոմատ կերպով սկանավորել ամբողջ հոդվածները և տեքստից հանել որոշ հիմնարար սուբյեկտներ և դասակարգել դրանք նախապես սահմանված կատեգորիաների:

Ի՞նչ է կոչվում սուբյեկտի ճանաչումը բացատրել օրինակների օգնությամբ:

Անվանված կազմակերպությունների ճանաչումը (NER) օգնում է հեշտությամբ բացահայտել տեքստի հիմնական տարրերը, ինչպիսիք են մարդկանց անունները, վայրերը, ապրանքանիշերը, դրամական արժեքները և այլն: Տեքստում հիմնական սուբյեկտների դուրսբերումը օգնում է տեսակավորել չկառուցված տվյալները և հայտնաբերել կարևոր տեղեկատվություն, ինչը կարևոր է, եթե դուք գործ ունեք տվյալների մեծ հավաքածուների հետ:

Որտե՞ղ է օգտագործվում անվանված կազմակերպության ճանաչումը:

Անվանված կազմակերպությունների ճանաչումը կարող է ավտոմատ կերպով սկանավորել ամբողջ հոդվածները և բացահայտել, թե որոնք են դրանցում քննարկված հիմնական մարդիկ, կազմակերպություններ և վայրեր: Յուրաքանչյուր հոդվածի համապատասխան պիտակների իմացությունը օգնում է հոդվածները ավտոմատ կերպով դասակարգել սահմանված հիերարխիաներում և հնարավորություն է տալիս սահուն բովանդակության հայտնաբերում:

Ինչպե՞ս եք ստեղծում անվանակոչված կազմակերպության ճանաչում:

  1. Ավելացրեք կազմակերպության նոր պիտակըճանաչիչ՝ օգտագործելով add_label մեթոդը։
  2. Շրջեք օրինակները և զանգահարեք nlp: թարմացում, որն անցնում է մուտքագրման բառերի միջով: Յուրաքանչյուր բառի վրա այն կանխատեսում է անում: …
  3. Պահեք վերապատրաստված մոդելը՝ օգտագործելով nlp: to_disk.
  4. Փորձեք մոդելը՝ համոզվելու համար, որ նոր կազմը ճիշտ է ճանաչվել։

Խորհուրդ ենք տալիս: