1C البحث عن النص الكامل. البحث عن النص الكامل وإمكانياته

3.4.9 البحث عن النص الكامل: البحث الآلي عن المستندات، حيث يتم استخدام النص الكامل أو أجزاء مهمة من النص كصورة بحث للمستند. البحث عن النص الكاملالاب. البحث عن نص متكامل)

فهرس النص الكامل

تضمنت الإصدارات الأولى من برامج البحث عن النص الكامل مسح المحتوى الكامل لجميع المستندات بحثًا عن كلمة أو عبارة معينة. عند استخدام هذه التكنولوجيا، استغرق البحث وقتا طويلا جدا (اعتمادا على حجم قاعدة البيانات)، وعلى الإنترنت سيكون من المستحيل. الخوارزميات الحديثةيتم تكوين ما يسمى بفهرس النص الكامل مسبقًا للبحث - وهو قاموس يسرد جميع الكلمات ويشير إلى الأماكن التي تظهر فيها. إذا كان هذا الفهرس موجودا، يكفي البحث الكلمات الصحيحةفيه وبعد ذلك ستتلقى على الفور قائمة بالمستندات التي تحدث فيها.

ملحوظات

أنظر أيضا


مؤسسة ويكيميديا. 2010.

تعرف على معنى "البحث عن النص الكامل" في القواميس الأخرى:

    الاسترجاع الآلي للمعلومات، حيث يتم استخدام النص الكامل أو أجزاء مهمة من النص كصورة بحث للمستند. باللغة الإنجليزية: البحث عن النص الكامل أنظر أيضًا: البحث الآلي عن المعلومات... ... القاموس المالي

    البحث عن النص الكامل- البحث الآلي عن المستندات، حيث يتم استخدام النص الكامل أو أجزاء مهمة من النص كصورة بحث للمستند. [GOST 7.73 96] البحث في المواضيع ونشر المعلومات معلومات المصطلحات العامة ... دليل المترجم الفني

    البحث عن النص الكامل- 3.4.9 البحث عن النص الكامل: البحث الآلي عن المستندات، حيث يتم استخدام النص الكامل أو أجزاء مهمة من النص كصورة بحث لمستند en البحث عن النص الكامل fr Recherche en texte Integrated Source ...

    البحث عن النص الكامل- Rus: البحث عن النص الكامل Eng: البحث عن النص الكامل Fra: recherche en texte Integrated البحث الآلي عن المستندات، حيث يتم استخدام النص الكامل أو الأجزاء المهمة من النص كصورة بحث للمستند. غوست 7.73 ... معجم المعلومات وعلم المكتبات والنشر

    البحث عن النص الكامل- وفقًا لـ GOST 7.73–96 "البحث عن المعلومات ونشرها. "المصطلحات والتعريفات" عبارة عن بحث آلي عن المستندات يتم فيه استخدام النص الكامل أو أجزاء مهمة من النص كصورة بحث للمستند... إدارة السجلات والأرشفة من حيث المصطلحات والتعاريف

    استرجاع البيانات هو فرع من علوم الكمبيوتر يدرس خوارزميات البحث عن المعلومات ومعالجتها سواء في البنية المنظمة (انظر، على سبيل المثال، قواعد البيانات) أو غير المنظمة (على سبيل المثال، وثيقة نصية) بيانات. يرتبط استرجاع البيانات ارتباطًا وثيقًا بالمفهوم... ... ويكيبيديا

    استرجاع المعلومات (IR) هي عملية البحث عن معلومات وثائقية غير منظمة وعلم هذا البحث. المحتويات 1 التاريخ 2 استرجاع المعلومات كعملية ... ويكيبيديا

    - (استرجاع المعلومات باللغة الإنجليزية) عملية البحث عن المعلومات الوثائقية غير المنظمة التي تلبي الاحتياجات المعلوماتية (الإنجليزية) الروسية، وعلم هذا البحث... ويكيبيديا

    GOST 7.73-96: نظام معايير المعلومات والمكتبات والنشر. البحث ونشر المعلومات. المصطلحات والتعاريف- المصطلحات GOST 7.73 96: نظام معايير المعلومات والمكتبات والنشر. البحث ونشر المعلومات. المصطلحات والتعريفات المستند الأصلي: 3.2.5 المعلومات الآلية نظام البحث: اي بي اس،... ... كتاب مرجعي للقاموس لمصطلحات التوثيق المعياري والتقني

كتب

  • تاريخ بيزنطة. قارئ. الجزء 2. الوثائق والأبحاث التاريخية (DVD)، فلاديمير مارتوف، تصدر DirectMedia Publishing سلسلة Clio جديدة، وهي عبارة عن سلسلة من المنشورات حول تاريخ العالم. يفتحون سلسلة مختارات عن تاريخ بيزنطة - "مؤرخو بيزنطة"... التصنيف: تاريخ. الوسائط المتعددةالناشر:

محرك بحث النص الكامل

قدرات البحث الأساسية عن النص الكامل

  • دعم الترجمة الصوتية (كتابة الكلمات الروسية باستخدام الأحرف اللاتينية وفقًا لـ GOST)؛
  • دعم الاستبدال (كتابة جزء من الأحرف بالكلمات الروسية بأحرف لاتينية ذات مفتاح واحد)؛
  • إمكانية البحث الغامض (قد تختلف الحروف الموجودة في الكلمات الموجودة) مع الإشارة إلى العتبة الغامضة؛
  • القدرة على تحديد نطاق البحث لكائنات البيانات التعريفية المحددة؛
  • عرض نتائج البحث بتنسيق XML وHTML مع تسليط الضوء على الكلمات التي تم العثور عليها؛
  • فهرسة النص الكامل لأسماء الحقول القياسية ("الكود"، "الاسم"، وما إلى ذلك) بجميع لغات التكوين؛
  • إجراء بحث مع الأخذ في الاعتبار مرادفات اللغات الروسية والإنجليزية والأوكرانية؛
  • يحتوي القاموس المورفولوجي للغة الروسية على عدد من الكلمات المحددة المتعلقة بمجالات النشاط المؤتمتة باستخدام نظام برنامج 1C:Enterprise؛
  • القدرة على استخدام قواميس إضافية للبحث عن النص الكامل؛
  • تتضمن القواميس المتوفرة قواعد بيانات القاموس وقواميس المرادفات والمرادفات الروسية والأوكرانية و اللغات الانجليزيةمقدمة من شركة "إنفورماتيك".

البحث في قاعدة بيانات النص الكامل

تتيح لك آلية البحث عن النص الكامل في بيانات نظام 1C:Enterprise 8 البحث في قاعدة البيانات التي تشير إلى عوامل تشغيل البحث (AND، OR، NOT، NEXT، وما إلى ذلك).

تعتمد آلية البحث عن النص الكامل على استخدام مكونين:

  • فهرس النص الكامل الذي يتم إنشاؤه لقاعدة البيانات الحالية ثم يتم تحديثه بشكل دوري حسب الحاجة؛
  • أدوات البحث عن النص الكامل.

يمكن إنشاء فهرس نص كامل وتحديثه بشكل تفاعلي، في وضع 1C:Enterprise 8، أو برمجيًا باستخدام اللغة المضمنة. يوجد أدناه مربع الحوار لإدارة فهرسة النص الكامل في 1C: وضع المؤسسة:

لإجراء بحث عن البيانات في قاعدة بيانات، على سبيل المثال، يمكن استخدام معالجة بحث البيانات الموضحة أدناه.

في المثال المعروض، تم العثور على مستندات تحتوي تفاصيلها على قيم تبدأ بـ "Kompl" و"vent" - الطرف المقابل "Kompletk TD" وتفاصيل تحتوي على أشكال مختلفة من كلمة "ventilator".

يسمح نظام 1C:Enterprise 8 بالتضمين الانتقائي لبيانات كائن التطبيق وتفاصيلها في البحث عن نص كامل. من الممكن أيضًا قصر نطاق البحث على كائنات التكوين المحددة فقط.

البحث عن النص الكامل في نظام المساعدة

يقوم نظام المساعدة 1C:Enterprise 8 أيضًا بتنفيذ البحث عن النص الكامل، والذي يسمح لك باستخدام عوامل تشغيل البحث AND وOR وNOT وNEXT وما إلى ذلك. في هذه الحالة، يتم تمييز الكلمات التي تم العثور عليها.

واجهة البرنامج

يتم استخدام كائنات التطبيق التالية:

  • مدير البحث عن النص الكامل
  • قائمة البحث عن النص الكامل
  • FullTextSearchListElement

يحتوي مدير بحث النص الكامل على طرق لإنشاء فهرس بحث، والتحقق من ملاءمته، وكذلك إنشاء قائمة بحث من نوع قائمة بحث النص الكامل لاستعلام معين.

يتوفر مدير FullTextSearch كخاصية للسياق العام FullTextSearch.

توفر قائمة FullTextSearch إمكانية الوصول إلى نتائج البحث. يمكنك أيضًا تحديد نطاق البحث كمصفوفة من عناصر بيانات تعريف التكوين.

نتيجة البحث هي FullTextSearchListElement.

مشغلي سلسلة البحث

يمكن استخدام عوامل تشغيل البحث التالية في سطر الإدخال:

AND (AND أو #) - ابحث عن البيانات التي تحتوي على جميع الكلمات؛ مثال: "السجل والمستند" - يجب أن تحتوي التفاصيل على كل من "السلوك" و"الوثيقة" (مع مراعاة الشكل الشكلي)؛

أو (OR أو | أو،) - ابحث عن كلمة واحدة على الأقل من الكلمات المدرجة؛ مثال: "سجل أو مستند" - يجب أن تحتوي التفاصيل على كلمة واحدة على الأقل من كلمتي "سجل" أو "مستند"؛

NOT (NOT أو ~) - ابحث عن البيانات التي تحتوي تفاصيلها على الكلمة الأولى، وليس الثانية؛ مثال: "إغلاق ليس شهرًا" - سيتم العثور على كل شيء يحتوي على كلمة "إغلاق" ولكن لا يحتوي على كلمة "شهر". استخدام "~" في بداية السطر غير مسموح به؛

NEAR/n (NEAR/[+/-]n) - البحث عن البيانات التي تحتوي على الكلمات المحددة في سمة واحدة، مع مراعاة الشكل على مسافة n من الكلمات بين الكلمات.

تشير العلامة إلى الاتجاه الذي سيتم البحث فيه من الكلمة الأولى عن الكلمة الثانية ("+" - بعد الكلمة الأولى؛ "-" - قبل الكلمة الأولى).

إذا لم يتم تحديد الإشارة، فسيتم العثور على البيانات التي تحتوي على الكلمات المحددة على مسافة n من الكلمات من بعضها البعض.

ترتيب الكلمات لا يهم.

  • "مجفف شعر NEAR/3 هواء" - سيتم العثور على البيانات التي لا تزيد فيها كلمة "هواء" عن 3 كلمات قبل أو بعد عبارة "مجفف شعر"؛
  • مجفف شعر NEAR/+3 air - سيتم العثور على البيانات التي لا تحتوي كلمة "air" فيها على أكثر من 3 كلمات بعد كلمة "hair Dryer"؛
  • مجفف شعر NEAR/-3 air - سيتم العثور على البيانات التي لا تحتوي فيها كلمة "air" على أكثر من 3 كلمات قبل كلمة "hair Dryer".

NEAR - مشغل المسافة المبسطة: تقع كلتا الكلمتين على مسافة لا تزيد عن 8 كلمات عن بعضها البعض؛ مثال: "عقد وثيقة NEAR"؛

"" (النص بين علامتي اقتباس) - ابحث عن العبارة الدقيقة مع مراعاة الصرف، على سبيل المثال: "نشر مستند" - يعادل: نشر مستند /1؛

() - تجميع الكلمات (أي عدد من مستويات التداخل)؛ مثال: "(نشر | بيان) # (حساب، مستند)"؛

* - البحث باستخدام حرف البدل (استبدال نهاية الكلمة). يجب إدخال أكثر من حرف واحد مهم؛ على سبيل المثال: "doc*" - سيتم العثور على "document"، و"document"، و"documentary"، وما إلى ذلك؛

# - بحث غامض عن الكلمات التي تحتوي على عدد محدد من الاختلافات عن العدد المحدد (إذا لم يتم تحديده، إذن = 1)؛ مثال: الاستعلام "#System" سيجد "sistama"، "sivtema"؛ الاستعلام "النظام رقم 2" سيجد "sittama"، "settema"؛

البحث مع الأخذ في الاعتبار مرادفات اللغات الروسية والإنجليزية والأوكرانية. "!" يتم وضعها قبل الكلمة المقابلة؛ على سبيل المثال: البحث عن "!البلاط الأحمر" سيجد أيضًا "البلاط القرمزي" و"البلاط المرجاني".

إذا لم يتم تحديد عوامل تشغيل (تتم كتابة الكلمات مفصولة بمسافات)، فسيبحث البرنامج عن جميع الكلمات من الاستعلام باستخدام عامل التشغيل AND.

أمثلة

SearchList = FullTextSearch.CreateList(""، 20); SearchList.GetDescription = True;

ArrayMD = New Array(); ArrayMD.Add(Metadata.Directories.Products); ArrayMD.Add(Metadata.Documents.CashReceipt);

SearchList.SearchArea = ArrayMD; SearchList.SearchString = SearchInputField; SearchList.PortionSize = PortionSize; SearchList.FirstPart();

إذا كان SearchList.FullQuantity() = 0 ثم إذا SearchList.TooManyResults() ثم تحذير ("هناك عدد كبير جدًا من النتائج، يرجى تحسين الاستعلام الخاص بك.")؛ إنهاء إذا؛

يعود؛ إنهاء إذا؛

الكمية = SearchList.FullQuantity();

HTMLStr = SearchList.GetDisplay(FullTextSearchDisplayType.HTMLText); تقرير (StrHTML)؛

لكل فهرس = 0 حسب SearchList.Quantity-1 عنصر الحلقة = SearchList.Get(index); تقرير(البند.عرض); EndCycle;

الخصائص

يعمل البحث عن النص الكامل عبر مجموعة البيانات بأكملها، لذلك عند استخدامه، يجب عليك تمرير النتيجة من خلال مرشح الأمان.

على سبيل المثال، في نظام متعدد القواعد، تحتاج إلى قطع الكائنات من قواعد البيانات الأخرى.

وبالإضافة إلى ذلك، فإن هذا التصفية يتقاطع بشكل وثيق مع التحكم في الوصول. ومن المعروف أن آليات التفتيش في كثير من الأحيان هي "الثغرة" الأمنية.
تعتمد وظيفة البحث الجديدة على آليتين:
- البحث عن النص الكامل (يعمل بسرعة كبيرة ويتطلب الحد الأدنى من موارد الحوسبة)؛

- البحث باستخدام نظام إدارة قواعد البيانات (بشكل عام، تتناسب مدة البحث وتكلفة موارد الحوسبة مع كمية المعلومات الموجودة في الجدول). في التنفيذ الحالي، سيتم البحث في القائمةبدون استخدام
البحث عن النص الكامل في الحالات التالية (): - تم تعطيل فهرس النص الكامل على المستوى;
قاعدة المعلومات
- لا تتم فهرسة كائن الجدول الرئيسي بواسطة فهرس النص الكامل؛

- نتيجة البحث باستخدام البحث عن النص الكامل، تم تلقي خطأ.

إذا تم تمكين البحث عن النص الكامل في قاعدة المعلومات، ولم يتم تحديث الفهرس كليًا أو جزئيًا (من تجربتي، 95% من قواعد بيانات معلومات العملاء)، فسيتلقى المستخدم إما نتيجة بحث غير موثوقة أو فارغة عند البحث.
نسأل شركة 1C - ماذا تفعل؟ كيف نضمن موثوقية نتائج البحث في جميع الأوقات؟ نعم، لكي تكون نتائج البحث محدثة عند تمكين البحث عن النص الكامل، يتعين عليك التأكد من أن فهرس البحث عن النص الكامل محدث، ولا توجد خيارات أخرى للبحث الفعال والحديث. البحث حتى الآن حتى الآن ().

هل يوجد حتى الآن "فهرس نص كامل محدث"؟ يعتمد ذلك على عدد المستخدمين، وكثافة التغييرات في المعلومات في قاعدة البيانات، وتكرار تحديثات الفهرس. عادةً، يتم تشغيل تحديثات الفهرس كل 60 ثانية. إنه لأمر جيد إذا لم يتم تغيير الكثير من الكائنات، وتمكن الإجراء من معالجة جميع التغييرات في هذه الثواني الستين. ماذا لو قمت بإعادة نشر مجموعة من المستندات، أو إعادة كتابة الدليل على نطاق واسع؟ في هذه الحالة، لا يمكن لأحد أن يضمن الوقت الذي سيوفر فيه بحث الفهرس بيانات موثوقة مرة أخرى.
من حيث المبدأ، هذا ليس بالغ الأهمية بشكل خاص، إلا في حالات قليلة. أحد الخيارات الشائعة للمستخدمين هو تعيين تحديد في القائمة حسب بعض القيمة، على سبيل المثال، "الحساب"، أو إدخال قيمة جديدة أو نسخ مستند موجود وكتابته. مع البحث القديم مستند جديدكان مرئيًا على الفور في القائمة. الآن لن يراها المستخدم إلا بعد N ثانية في أفضل الأحوال، حيث N أقرب إلى 50-60 ثانية بدلاً من 2-3.
إذا لم تلاحظ عدم وجود مستند جديد وتقديم معلومات لشخص ما بناءً على النتائج المحددة، فسيكون ذلك غير موثوق به عمدًا.

كان هذا هو الحال عملية عاديةمع قاعدة المعلومات. ماذا سيحدث في مواقف محددة؟ اسمحوا لي أن أقدم لكم بضعة أمثلة.
1) في قاعدة البيانات العاملة، يتم تمكين فهرس النص الكامل وتحديثه بشكل متكرر. يطلب المستخدم نشر نسخة من قاعدة البيانات العاملة حتى يتمكن من تحليل البيانات.
نقوم باستعادة النسخة الاحتياطية ومنح حق الوصول. لكن البحث عن النص الكامل لن ينجح، لأن... لا يتم تخزين الفهرس في نظام إدارة قواعد البيانات (DBMS)، بل في ملفات منفصلة(سواء في الملف أو في نسخة خادم العميل). لا يوجد فهرس في ملف dt.
أولئك. لكي يتمكن المستخدم من استخدام البحث في القائمة، يجب تعطيل فهرس النص الكامل في قاعدة البيانات هذه. صحيح أن المستخدم سوف يفاجأ قليلاً بأن البحث سيستغرق وقتًا أطول. أو قم بإعادة بناء الفهرس عبر قاعدة البيانات بأكملها.

2) (ذات صلة بقواعد البيانات الكبيرة إلى حد ما). تحتوي قاعدة بيانات الإنتاج على فهرس نص كامل ممكّن ويتم تحديثه بشكل متكرر. ويأتي نهاية الشهر ويبدأ إغلاق الفترة. لقد بدأنا في تحميل المستندات وإعادة توجيهها بشكل جماعي. لتقليل الحمل على النظام، نقوم بحظر التنفيذ مهام روتينيةوبناء على ذلك، يتوقف تحديث الفهرس. سوف يشعر المستخدمون، بعبارة ملطفة، بالحيرة بشأن سبب عدم وجود مستندات جديدة أو متغيرة في القوائم. السبيل الوحيد للخروج هو تعطيل البحث عن النص الكامل لقاعدة المعلومات، وبالتالي الحصول على المزيد حمل ثقيلللمعدات بسبب صعوبة البحث باستخدام كل التفاصيل.

وبالتالي، يبدو لي أن عملية تحديث الفهرس ستصبح صداعًا آخر لمديري قواعد المعلومات.
النظام، الذي كان يضمن في السابق موثوقية وأهمية المعلومات بنسبة 100% في أي وقت، يتحول الآن إلى أكثر من مجرد نظام نظام المساعدة، حيث لا يمكن للمرء أن يكون متأكدا تماما.
ويحصل المستخدمون على سبب آخر لتوبيخ موظفي تكنولوجيا المعلومات - "نظامك لا يعمل بشكل صحيح".



تحميل...
قمة