1c teljes szöveges keresés. Teljes szöveges keresés és szolgáltatásai

3.4.9 teljes szöveges keresés: Automatizált dokumentumkeresés, amelyben a teljes szöveg vagy a szöveg jelentős része egy dokumentum keresőképeként kerül felhasználásra. Teljes szöveges keresés, fr. Recherche en texte integral)

Teljes szöveges index

A teljes szövegű keresőprogramok első verzióiban az összes dokumentum teljes tartalmát beszkennelték egy adott szó vagy kifejezés keresésére. Ennek a technológiának a használatakor a keresés nagyon sokáig tartott (az adatbázis méretétől függően), és az interneten lehetetlen lenne. Modern algoritmusok előzetesen egy úgynevezett teljes szövegű indexet alakítanak ki a kereséshez - egy szótárat, amelyben minden szó szerepel, és jelzi, hogy mely helyeken fordul elő. Ha van ilyen index, akkor elég rákeresni a megfelelő szavakat benne, majd azonnal megkapjuk azoknak a dokumentumoknak a listáját, amelyekben előfordulnak.

Megjegyzések

Lásd még

Wikimédia Alapítvány. 2010 .

Nézze meg, mi a "Teljes szöveges keresés" más szótárakban:

Automatizált információkeresés, amelyben a teljes szöveget vagy a szöveg lényeges részeit egy dokumentum keresőképeként használják. Magyarul: Teljes szöveges keresés Lásd még: Automatizált információkeresés ... ... Pénzügyi szókincs

teljes szöveges keresés- Automatikus dokumentumkeresés, amelyben a teljes szöveg vagy a szöveg lényeges részei a dokumentum keresőképeként kerülnek felhasználásra. [GOST 7.73 96] Témák keresése és információ terjesztése Általános kifejezések információ ... Műszaki fordítói kézikönyv

teljes szöveges keresés- 3.4.9 teljes szöveges keresés: Automatizált dokumentumkeresés, amelyben a teljes szöveg vagy a szöveg jelentős része a dokumentum keresőképeként kerül felhasználásra hu Teljes szöveges keresés fr Recherche en texte integral Forrás ...

teljes szöveges keresés- Rus: teljes szöveges keresés Eng: teljes szöveges keresés Fra: recherche en texte integral Automatizált dokumentumkeresés, amelyben a teljes szövegét vagy a szöveg jelentős részeit egy dokumentum keresőképeként használják. GOST 7.73... Információs, könyvtári és kiadói szótár

TELJESSZÖVEG KERESÉS- a GOST 7.73–96 „Információ keresése és terjesztése” szerint. Kifejezések és definíciók” egy olyan automatizált dokumentumkeresés, amelyben a teljes szövegét vagy a szöveg lényeges részeit egy dokumentum keresőképeként használják... Irodai munka és archiválás fogalmak és definíciók szerint

Az adatvisszakeresés a számítástechnikának egy olyan ága, amely az információk keresésének és feldolgozásának algoritmusait vizsgálja strukturált (lásd például adatbázisok) és strukturálatlan (pl. Szöveges dokumentum) adatok. Az adatkeresés elválaszthatatlanul kapcsolódik a ... ... Wikipédia fogalmához

Az információkeresés (IP) a strukturálatlan dokumentuminformációk keresésének folyamata és ennek a keresésnek a tudománya. Tartalom 1 Történelem 2 Információkeresés mint folyamat ... Wikipédia

- (angol Information retrieval) az információs igényeket kielégítő, strukturálatlan dokumentuminformációk keresésének folyamata (angol) orosz, és a keresésről szóló tudomány ... Wikipédia

GOST 7.73-96: Információs, könyvtári és publikációs szabványrendszer. Információk keresése és terjesztése. Kifejezések és meghatározások- Terminológia GOST 7.73 96: Információs, könyvtári és publikációs szabványrendszer. Információk keresése és terjesztése. Kifejezések és meghatározások eredeti dokumentum: 3.2.5 automatizált információ kereső rendszer: IPS, ...... A normatív és műszaki dokumentáció kifejezéseinek szótár-referenciája

Könyvek

Bizánc története. Olvasó. 2. rész Történelmi dokumentumok és kutatások (DVD), Vlagyimir Martov, a "Directmedia Publishing" kiadó új sorozatot ad ki "Clio", amely a világtörténelemről szóló kiadványsorozat. Nyisson meg egy olvasósorozatot Bizánc történetéről - "Bizánc történészei" ... Kategória: Történelem. Multimédia Kiadó:

Teljes szöveges kereső

A teljes szöveges keresés alapvető funkciói

átírási támogatás (orosz szavak írása latin karakterekkel a GOST szerint);
helyettesítési támogatás (a karakterek egy részének írása orosz szavakkal egybillentyűs latin karakterekkel);
a fuzzy keresés lehetősége (a talált szavak betűi eltérhetnek) a fuzzy küszöb megjelölésével;
a kiválasztott metaadat-objektumok keresési hatókörének megadása;
keresési eredmények bemutatása XML és HTML formátumban a talált szavak kiemelésével;
a szabványos mezők nevének teljes szöveges indexelése ("Kód", "Név" stb.) minden konfigurációs nyelven;
keresés végrehajtása az orosz, angol és ukrán nyelvek szinonimáinak figyelembevételével;
az orosz nyelv morfológiai szótára számos konkrét szót tartalmaz, amelyek az 1C: Enterprise szoftverrendszerrel automatizált tevékenységi területekhez kapcsolódnak;
további teljes szövegű keresőszótárak használatának képessége;
A szállított szótárak szótárbázisokat és tezaurusz-szótárakat, valamint orosz, ukrán és angol az Informatika biztosítja.

Teljes szöveges keresés az adatbázisban

Az 1C:Enterprise 8 rendszer adataiban a teljes szöveges keresés mechanizmusa lehetővé teszi az adatbázisban való keresést a keresési operátorok megjelölésével (ÉS, VAGY, NEM, NEAR stb.).

A teljes szöveges keresési mechanizmus két összetevő használatán alapul:

egy teljes szövegű index, amelyet az aktuális adatbázishoz hoznak létre, majd szükség szerint rendszeresen frissítenek;
teljes szöveges keresőeszközök.

A teljes szövegű index létrehozása és frissítése történhet interaktívan, 1C:Enterprise 8 módban vagy programozottan, a beépített nyelv használatával. Az alábbi párbeszédpanel a teljes szöveges indexelés kezeléséhez 1C:Enterprise módban:

Például egy adatbázisban lévő adatok kereséséhez az alábbi adatkeresési feldolgozás használható.

A bemutatott példában olyan dokumentumokat találtunk, amelyek részletei a "Complete" és a "vent" kezdetű értékeket tartalmazzák - a partner "Complete TD", valamint a "fan" szó különböző formáit tartalmazó részleteket.

Az 1C:Enterprise 8 rendszer lehetővé teszi az alkalmazásobjektumok adatainak és azok részleteinek szelektív felvételét a teljes szöveges keresésbe. Lehetőség van arra is, hogy a keresési hatókört csak meghatározott konfigurációs objektumokra korlátozzuk.

Teljes szöveges keresés a súgórendszerben

Az 1C:Enterprise 8 súgórendszere teljes szöveges keresést is megvalósít, amely lehetővé teszi az AND, OR, NOT, NEAR stb. keresési operátorok használatát. Ebben az esetben a talált szavak kiemelve jelennek meg.

Szoftver interfész

A következő alkalmazásobjektumokat használják:

Teljes szöveges keresés kezelője
ListFullTextSearch
ItemListFullTextSearch

A FullTextSearch Manager módszerekkel rendelkezik keresési index felépítésére, érvényességének ellenőrzésére és FullTextSearchList típusú keresési lista létrehozására egy adott lekérdezéshez.

A FullTextSearch Manager a FullTextSearch globális kontextus tulajdonságaként érhető el.

A FullTextSearch List hozzáférést biztosít a keresési eredményekhez. A keresési hatókört konfigurációs metaadatelemek tömbjeként is megadhatja.

A keresés eredménye egy FullTextSearchListItem.

Karakterlánc-operátorok keresése

A következő keresési operátorok engedélyezettek a beviteli sorban:

ÉS (ÉS vagy #) - az összes szót tartalmazó adatok keresése; példa: "rekord ÉS dokumentum" - az adatoknak tartalmazniuk kell a "végrehajtás" és a "dokumentum" kifejezést is (a morfológiát figyelembe véve);

VAGY (OR vagy | vagy,) - a felsorolt szavak közül legalább egyet keressen; példa: "rekord VAGY dokumentum" - a "rekord" vagy a "dokumentum" szavak legalább egyikének szerepelnie kell a részletekben;

NEM (NOT vagy ~) - olyan adatok keresése, amelyek adatai tartalmazzák az első szót, de a másodikat nem; példa: "zárás NEM hónap" - minden megtalálható, amely tartalmazza a "zárás" szót, de nem tartalmazza a "hónap" szót. A "~" használata a sor elején nem megengedett;

NEAR/n (NEAR/[+/-]n) - a megadott szavakat egy attribútumban tartalmazó adatok keresése, figyelembe véve a morfológiát n szónyi távolságra a szavak között.

A jel azt jelzi, hogy az első szótól kezdődően a második szó melyik irányban lesz keresve ("+" - az első után; "-" - az első szó előtt).

Ha az előjel nincs megadva, akkor a megadott szavakat egymástól n szónyi távolságra tartalmazó adatok találhatók.

A szavak sorrendje nem számít.

"hajszárító NEAR/3 levegő" - olyan adatok találhatók, amelyekben a "levegő" nem több, mint 3 szó a "hajszárító" előtt vagy után;
hajszárító NEAR/+3 air - olyan adatok találhatók, amelyekben a "levegő" nem több, mint 3 szó a "hajszárító" után;
hajszárító NEAR/-3 air - olyan adatok találhatók, amelyekben a "levegő" nem több, mint 3 szó a "hajszárító" előtt.

NEAR (NEAR) - egy egyszerűsített távolsági operátor: mindkét szó legfeljebb 8 szóra található egymástól; példa: "NEAR dokumentum tartása";

"" (szöveg idézőjelben) - pontos kifejezés keresése a morfológiát figyelembe véve, példa: "dokumentum küldése" - megfelelő: /1 dokumentum tartása;

() - szócsoportosítás (bárhány egymásba ágyazási szint); példa: "(könyvelés | kimutatás) # (számla, bizonylat)";

* - keresés helyettesítő karakterrel (a szó végének helyettesítése). 1-nél több jelentős karaktert kell megadni; példa: "docu*" - megkeresi a "dokumentumot", "dokumentumot", "dokumentumfilmet" stb.;

# - fuzzy keresés olyan szavakra, amelyek adott számú eltérést tartalmaznak a megadotttól (ha nincs megadva, akkor = 1); példa: a "#System" lekérdezés megtalálja a "rendszer", "rendszer" kifejezést; a "System#2" lekérdezés megtalálja a "sittama", "settema" kifejezést;

Keresés az orosz, angol és ukrán nyelvek szinonimája alapján. "!" a megfelelő szó elé kerül; példa: ha a "!red tile" kifejezésre keres, a "skarlát csempe" és a "korall csempe" is megtalálható.

Ha nincs megadva operátor (a szavak szóközzel vannak beírva), akkor a program az ÉS operátor segítségével megkeresi a lekérdezés összes szóját.

Példák

SearchList = FullTextSearch.CreateList("", 20); SearchList.GetDescription = igaz;

ArrayMD = Új tömb(); ArrayMD.Add(Metadata.Catalogs.Products); ArrayMD.Add(Metadata.Documents.CashReceipt);

SearchList.SearchArea = ArrayMD; SearchList.SearchString = SearchInputField; SearchList.PortionSize = PortionSize; SearchList.FirstPart();

If SearchList.FullCount() = 0 Then If SearchList.TooManyResults() Then Warning("Túl sok találat, kérjük, finomítsa a lekérdezést."); EndIf; Visszatérés; EndIf;

Szám = SearchList.FullCount();

StrHTML = SearchList.GetDisplay(FullTextSearchDisplayType.HTMLText); Jelentés(StrHTML);

Minden indexhez=0 By LookupList.Count-1 Loop elem = LookupList.Get(index); Report(elem.View); EndCycle;

Sajátosságok

A teljes szöveges keresés a teljes adattömbön működik, ezért használatánál az eredményt egy biztonsági szűrőn kell átvezetni.

Például egy többbázisú rendszerben le kell vágnia az objektumokat a többi bázisról.

Ezenkívül az ilyen szűrés szorosan összefügg a hozzáférés-vezérléssel. Köztudott, hogy nagyon gyakran a "lyuk" a biztonságban éppen a keresési mechanizmusok.

Az új keresés funkcionalitása két mechanizmuson alapul:
- teljes szöveges keresés (nagyon gyorsan működik, és minimális számítási erőforrást igényel);
- keresés DBMS segítségével (általános esetben a keresés időtartama és a számítási erőforrások költsége arányos a táblázatban szereplő információ mennyiségével).

A jelenlegi megvalósításban a lista keresésre kerül használat nélkül teljes szöveges keresés a következő esetekben ():
- a teljes szöveges index le van tiltva a szinten információs bázis;
- a főtábla objektumát nem indexeli a teljes szövegű index;
- a teljes szöveges kereséssel végzett keresés eredményeként hiba érkezett.

Ha az infobázisban engedélyezve van a teljes szöveges keresés, és az index egyáltalán vagy részben nem frissül (az Ügyfél információbázisainak 95%-ának gyakorlata szerint), akkor a felhasználó a keresés során megbízhatatlan vagy üres keresési eredményt kap. .

Megkérdezzük az 1C cégtől – hogyan legyünk? Hogyan biztosítható, hogy a keresési eredmények mindig érvényesek legyenek?
Megkapjuk a választ: Igen, ahhoz, hogy a keresési eredmények naprakészek legyenek, amikor a teljes szöveges keresés engedélyezve van, gondoskodnia kell arról, hogy a teljes szöveges keresési index naprakész legyen. Nincs más lehetőség a hatékony és naprakész keresésre. az aktuális keresés még ().

És általában van-e "valódi teljes szövegű index"? Függ a felhasználók számától, az adatbázis információváltozásának intenzitásától és az indexfrissítések gyakoriságától. Az indexfrissítés általában 60 másodpercenként fut. Nos, ha nem sok objektumot változtattak meg, és az eljárásnak sikerült az összes változást feldolgozni ebben a 60 másodpercben. És ha egy dokumentumcsoport újbóli közzétételét vagy a címtár tömeges átírását végezné el? Ebben az esetben senki sem tudja garantálni azt az időt, amely után az indexben végzett keresés ismét megbízható adatokat ad.
Ez elvileg nem különösebben kritikus, kivéve néhány helyzetet. Gyakori lehetőség a felhasználók számára az, hogy a listában valamilyen érték alapján kiválasztanak egy kijelölést, például "Szerződés fél", beírnak egy újat, vagy másolnak egy meglévő dokumentumot, és írják le. A régi kereséssel új dokumentumot azonnal látható a listában. A felhasználó most a legjobb esetben is csak N másodperc után fogja látni, ahol N közelebb van 50-60 másodperchez, nem pedig 2-3-hoz.
Ha nem veszi észre, hogy nincs új dokumentum, és a kiválasztott eredmények alapján ad tájékoztatást valakinek, akkor nyilvánvalóan megbízhatatlan lesz.

Az ügyben volt normál működés információs bázissal. Mi történik konkrét helyzetekben? Mondok egy-két példát.
1) A működő adatbázisban a teljes szövegű index engedélyezve van és gyakran frissül. A felhasználó azt kéri, hogy telepítse neki a működő adatbázis egy példányát, hogy elemezze a rajta lévő adatokat.
Visszaállítjuk a biztonsági másolatot, és hozzáférést biztosítunk. De a teljes szöveges keresés nem fog működni, mert. az indexet nem a DBMS-ben tárolják, hanem benne külön fájlokat(fájlban és fájlban is kliens-szerver verzió). Az index nincs a dt fájlban.
azok. ahhoz, hogy a felhasználó használni tudja a listás keresést, ebben az adatbázisban ki kell kapcsolni a teljes szöveges indexet. Igaz, a felhasználó kissé meg fog lepődni, hogy a keresés sokkal tovább tart. Vagy építse újra az indexet a teljes adatbázisban.

2) (Tényleges többé-kevésbé nagy alapokra). Az éles adatbázisban a teljes szövegű index engedélyezve van, és gyakran frissül. Eljön a hónap vége és kezdődik az időszak lezárása. Megkezdjük a dokumentumok tömeges betöltését és átadását. A rendszer terhelésének csökkentése érdekében blokkoljuk a végrehajtást rutinfeladatokat, illetve az index frissítése leáll. A felhasználók finoman szólva is tanácstalanok lesznek – miért nincsenek új vagy megváltozott dokumentumok a listákon. Az egyetlen kiút az információs bázis teljes szöveges keresésének letiltása, és ennek megfelelően további beszerzése nehéz rakomány a berendezéseken az összes részlet intenzív keresése miatt.

Így számomra úgy tűnik, hogy az indexfrissítési művelet újabb fejtörést okoz az infobázis rendszergazdái számára.
A rendszer, amely korábban garantálta az információk 100%-os pontosságát és relevanciáját bármikor, most átalakul súgórendszer amiben nem lehet teljesen biztos.
A felhasználók pedig újabb okot kapnak arra, hogy szemrehányást tegyenek az informatikusoknak: "a rendszer nem működik megfelelően".