إدارة البيانات الفوقية

البيانات الفوقية

بشكل عام يضم دي سبيس ثلاثة أنواع من البيانات الفوقية حول المحتوى المحفوظ:

  1. البيانات الفوقية الوصفية : يمكن لدي سبيس دعم عدة مخططات بيانات فوقية لوصف مادة. يتوفرمخطط بيانات فوقية دبلن كور مؤهل مبني على مجموعة عناصر ومؤهلات وضع تطبيق مكتبي افتراضياً. تأتي مجموعة العناصر والمؤهلات المستخدمة من قبل مكتبات MIT بتهيئة مسبقة مع رمز مصدر دي سبيس. مع ذلك، يمكنك تهيئة عدة مخططات وتحديد حقول البيانات الفوقية من خليط من المخططات المهيئة لوصف موادك. قد توجد بيانات فوقية وصفية أخرى حول المواد (أي بيانات فوقية موصوفة في مخطط هرمي) في دفق بت متسلسل. توجد للمجتمعات والحاويات بعض البيانات الفوقية البسيطة (الاسم، وبعض النثر الوصفي)، موجودة في DBMS.

  • البيانات الفوقية الإدراية : وتشمل بيانات الحفظ الفوقية، بيانات سياسة المنشأ والتخويل. يتم الاحتفاظ بمعظم ذلك في مخطط DBMS الارتباطي. يتم تخزين بيانات المنشأ الفوقية (النثر) في تسجيلات دبلن كور. بالإضافة إلى ذلك، يتم نسخ بعض البيانات الفوقية الإدارية الأخرى (على سبيل المثال، أحجام بايت دفق البت وأنواع MIME) في تسجيلات دبلن كور لتسهيل الوصول إليها من خارج دي سبيس.

  • البيانات الفوقية الهيكلية (البنائية) : وتشمل المعلومات الخاصة بكيفية تقديم مادة أو دفق بت في مادة إلى مستخدم نهائي، والعلاقة بين الأجزاء المكونة للمادة. على سبيل المثال، إذا كانت هناك أطروحة مكونة من عدد من صور TIFF وكل منها توضح صفحة واحدة من الأطروحة. قد تشمل البيانات الفوقية الهيكلية واقع أن كل صورة هي صفحة واحدة، وترتيب صفحات/ صور TIFF. البيانات الفوقية الهيكلية في دي سبيس حاليا أساسية بشكل كبير، في المادة، يمكن ترتيب دفق البت في حزم منفصلة كما هو مذكور أعلاه. قد يكون للحزمة اختياريا أيضا دفق بت رئيسي. يستخدم ذلك حاليا بواسطة دعم HTML لتوضيح أي من دفق البت في الحزمة هو ملف HTML لإرساله إلى المتصفح. بالإضافة إلى بعض البيانات الفوقية التقنية الأساسية، يملك دفق البت أيضا "معرّف تتابع" لتعريفه بشكل متفرد في مادة. يستخدم ذلك لإنتاج معرّف دفق بت مستمر لكل دفق بت. يمكن تخزين بيانات فوقية هيكلية إضافية في دفق بت متسلسل، لكن دي سبيس لا يفهم ذلك حاليا.
  • .



    تقديم دي سبيس اليدوي ونظام سير العمل

    عملية استيعاب دي سبيس

    مستورد المادة الكمي هو تطبيق يقوم بتحويل SIP خارجي ( مستند XML بيانات فوقية مع بعض ملفات المحتوى) إلى أداة "تقديم قيد العمل". كذلك يتم استخدام UI تقديم الويب بواسطة المستخدم النهائي لتجميع أداة "تقديم قيد العمل".




    الوصول من الانترنت إلى أصولك الرقمية

    الوصول من الانترنت إلى أصولك الرقمية

    إن تمثيل محتواك على الانترنت في شجرة منظمة من المجتمعات والحاويات هو خاصية أساسية لدي سبيس. يمكن للمستخدمين الوصول إلى صفحات المواد المفردة، تلك وصوف بيانات فوقية معا بملفات متاحة للتنزيل.

    بحث النص الكامل

    يمكن لدي سبيس معالجة محتويات مبنية على نص لبحث النص الكامل. مما يعني أن البيانات الفوقية التي توفرها لملف معين لن تكون قابلة للبحث فحسب، لكن سيتم فهرسة جميع محتوياتها أيضاً. مما يتيح للمستخدمين البحث عن كلمات مفتاحية محددة تظهر فقط في المحتوى الفعلي وليست في الوصف المقدم.

    التصفح

    يتيح دي سبيس للمستخدمين العثور على سبيلهم إلى محتوى ذي صلة بأكثر من طريقة، منها:

    1. البحث عن كلمة مفتاحية أو أكثر في البيانات الفوقية أو النص الكامل المستخلص.
    2. تصفح الأوجه عبر أي حقل في وصف المادة. البحث هو مكون أساسي للاكتشاف في دي سبيس. يتوقع المستخدم الكثير من محرك البحث لذا يهدف دي سبيس إلى توفير أكبر عدد ممكن من خصائص البحث. لدى نظام البحث والفهرسة الفرعي لدي سبيس API بسيط يسمح بفهرسة محتوى جديد، إعادة توليد الفهرس، وإجراء الأبحاث على المتن بأكمله، مجتمع أو حاوية. خلف ال API يوجد محرك بحث جافا Lucene المجاني. يمنحنا Lucene بحث بالحقول، حذف كلمة توقف، الاستئصال، والقدرة على إضافة محتوى مفهرس جديد تدريجيا بدون إعادة توليد الفهرس بأكمله. فهارس بحث Lucene المحددة قابلة للتهيئة مما يتيح للمؤسسات تخصيص أي حقول بيانات دي سبيس الفوقية سيتم فهرستها. عبر مرجع خارجي، مثل Handle.

    أحد آليات الاكتشاف الهامة الأخرى في دي سبيس هي الاستعراض. هذه هي العملية التي يرى فيها المستخدم فهرساً محدداً، مثل فهرس العنوان، ويتصفح عبره للبحث عن المواد الشيقة. يقوم نظام الاستعراض الفرعي عندئذ بكشف الجزء الخاص بالفهرس المرغوب. المؤشرات التي يمكن استعراضها هي عنوان المادة، تاريخ إصدار المادة، مؤلف المادة، ومصطلحات الموضوع. بالإضافة إلى ذلك، يمكن تحديد الاستعراض على مواد في حاوية معينة أو مجتمع معين.

    أنواع الملفات المدعومة

    يمكن لدي سبيس استيعاب أي نوع من الملفات المرفوعة. بالرغم من أن دي سبيس يشتهر باستضافة المواد المبنية على النص بما في ذلك الأطروحات الالكترونية والاتصالات الدراسية و الرسائل العلمية (ETDs)، يوجد العديد من حاملي الأسهم في المجتمع يستخدمون دي سبيس من أجل الوسائط المتعددة، ومواد التعلم والبيانات. وبالرغم من تطبيق بعض القيود، يمكن لدي سبيس أن يعمل كمتجر لأرشيفات HTML.

    يتم الإشارة للملفات اليت تم رفعها إلى دي سبيس غالباً بدفق البت. وسبب ذلك إلى حد كبير تاريخي ويعود إلى التنفيذ التقني. بعد الاستيعاب، يتم تخزين الملفات في دي سبيس في نظام الملفات كدفق من البت بدون امتداد الملف.




    إدارة المستخدم

    على الرغم من إمكانية بناء العديد من وظائف دي سبيس مثل اكتشاف الوثائق واستعادتها بشكل مجهول، فإن بعض الخصائص (وربما بعض الوثائق) تكون متاحة فقط لبعض المستخدمين "المميزين". الأشخاص الالكترونيين والمجموعات هي الطريقة التي يقوم بها دي سبيس بتعريف المستخدمين بغرض منحهم الامتيازات. هذه الهوية مرهونة بجلسة تطبيق دي سبيس كـ UI الويب أو أحد برامج دفعة سطر الأوامر. يتم منح الامتيازات للأشخاص الالكترونيين وللمجموعات بواسطة نظام الصلاحية الموصوف أدناه.

    حسابات المستخدم (الشخص الالكتروني)

    يحتفظ دي سبيس بالمعلومات التالية حول كل شخص الكتروني:

    1. عنوان البريد الالكتروني

    2. الأسماء الأولى والألقاب

    3. ما إذا كان باستطاعة المستخدم تسجيل الدخول إلى النظام عبر UI الويب، وما إذا كان يجب عليه استخدام شهادة X509 للقيام بذلك؛

    4. كلمة المرور (مشفرة)، إذا كانت مناسبة

    5. قائمة بالحاويات التي يرغب الشخص الالكتروني بتلقي اشعارات لوصول مواد جديدة لها

    6. ما إذا كان الشخص الالكتروني "ذاتي التسجيل" في النظام، ما إذا قام النظام بإنشاء تسجيلة الشخص الالكتروني تلقائيا كنتيجة لتسجيل المستخدم النهائي بشكل مستقل في النظام، كمقابل لإنشاء تسجيلة الشخص الالكتروني من قاعدة بيانات موظفي المؤسسة، على سبيل المثال.

    7. هوية الشبكة لتسجيلة LDAP المقابلة، إذا تم استخدام تصديق LDAP لهذا الشخص الالكتروني.

    الاشتراكات

    كما هو ملاحظ أعلاه، قد يقوم المستخدمون النهائيون (الأشخاص الالكترونيون) بالاشتراك في الحاويات ليتم تنبيههم عند ظهور مواد جديدة في تلك الحاويات. كل يوم، سيقوم المستخدمون النهائيون المشتركون في إحدى الحاويات أو أكثر بتلقي رسائل عبر البريد الالكتروني بتفاصيل مختصرة حول جميع المواد الجديدة التي ظهرت في أي من تلك المجموعات في اليوم السابق. إذا لم تظهر أي مواد جديدة في أي من الحاويات المشترك بها، لن يتم إرسال أي رسائل بريد الكتروني. يمكن للمستخدمين الغاء اشتراكهم في أي وقت. تلقيمات RSS للمواد الجديدة متاحة أيضا للحاويات والمجتمعات.


    المجموعات

    المجموعات هي نوع آخر من الكيانات التي يمكن منحها صلاحيات في نظام التخويل. المجموعة هي في العادة قائمة صريحة من الأشخاص الالكتروني؛ يمكن لأي شخص معرّف كأحد هؤلاء الأشخاص الالكترونيين أيضا الحصول على الامتيازات الممنوحة للمجموعة.

    غير أنه يمكن لجلسة تطبيق تعيين عضوية في مجموعة بدون التعريف كشخص الكتروني. على سبيل المثال، بعض المواقع تستخدم هذه الخاصية لتعريف مستخدمي شبكة محلية لكي يتمكنوا من قراءة المواد المقيدة غير المتاحة للعالم بأكمله. يتم منح الجلسات الناشئة من الشبكة المحلية عضوية في مجموعة "المستخدمين المحليين" واكتساب الامتيازات المقابلة.

    كما يمكن للمشرفين استخدام المجموعات كـ"أدوار" لإدارة منح الامتيازات بشكل أكثر كفاءة.



    التحكم في الوصول

    التصديق

    التصديق يكون عندما تقوم جلسة تطبيق بتعريف نفسها إيجابياً بانتمائها إلى شخص الكتروني و/أو مجموعة. في إصدار دي سبيس 1.4 وما يليه، يتم تنفيذ ذلك من خلال آلية تسمى التصديق القابل للتكويم. تقوم تهيئة دي سبيس بإعلان "كومة" من طرق التصديق. يقوم تطبيق (مثل UI الويب)باستدعاء مدير التصديق، والذي يجرب كلا من هذه الطرق لتعريف الشخص الالكتروني الذي تنتني لها الجلسة، وكذلك أي مجموعات إضافية.

    يتم تجربة طرق تصديق الشخص الالكتروني واحدة تلو الأخرى حتى تنجح إحداها. يتم منح كل مصدق في الكومة الفرصة لتعيين مجموعات إضافية. توفر هذه الآلية المميزات التالية:

    1. تفصل التصدق من واجهة مستخدم الويب لكي يتم استخدام نفس طرق التصديق للتطبيقات الأخرى كخدمات الويب غير التفاعلية.

    2. قابلية تركيب محسّنة: جميع طرق التصديق مستقلة عن بعضها البعض. يمكن "تكويم" طرق التصديق المخصصة فوق طريقة اسم مستخدم/ كلمة مرور دي سبيس الافتراضية.

    3. دعماً أنظف للتصديق "الضمني" حيث يتم العثور على اسم المستخدم في بيئة طلب ويب، مثال في شهادة عميل X.509.


    التخويل

    نظام التخويل في دي سبيس مبني على الإجراءات المصاحبة لأدوات وقوائم الأشخاص الالكترونيين الذين يمكنهم إجرائها. هذه الإجراءات المصاحبة تدعى سياسات المصدر، وقوائم الأشخاص الالكترونيين تدعى المجموعات. توجد مجموعتين مضمنتين: "المشرفين" والذين يمكنهم القيام بأي شيء في الموقع، و"المجهول" وهي قائمة تحتوي على كل المستخدمين. تعيين سياسة لإجراء على أداة إلى مجهول تعني منح الجميع صلاحيات للقيام بهذا الإجراء. (على سبيل المثال، معظم الأدوات في مواقع دي سبيس لديها سياسة قراءة "مجهولة"). يجب أن تكون الصلاحيات صريحة- نقص الصلاحية الصريحة يؤدي إلى سياسة "رفض" الافتراضية. الصلايحات كذلك لا يتم "تبديل" الصلاحيات؛ على سبيل المثال، إذا كان لشخص الكتروني صلاحية قراءة لمادة، لا يجب أن يكون لديه بالضرورة صلاحية قراءة على الحزم ودفق البت في تلك المادة. الحاويات، المجتمعات والمواد قابلة للاكتشاف حاليا في أنظمة التصفح والبحث بغض النظر عن تخويل القراءة.

    Table Style
    الحاوية
    إضافة/ إزالة إضافة أو إزالة المواد (إضافة = صلاحية تقديم المواد)
    قراءة_المادة_ الافتراضية تورث كقراءة بواسطة كل المواد المقدمة
    قراءة_دفق البت_الافتراضية تورث كقراءة بواسطة دفق البت لكل المواد المقدمة. ملاحظة: تؤثر فقط على دفق بت المادة في وقت تقديمها الأولي. إذا تمت إضافة دفق بت لاحقا، لا يحصل على نفس سياسة القراءة الافتراضية.
    مشرف_الحاوية يمكن لمشرفي الحاوية تحرير المواد الموجودة في الحاوية، سحب المواد، تخطيط مواد أخرى إلى هذه الحاوية.
    المادة
    إضافة/ إزالة إضافة أو إزالة الحزم
    قراءة يمكن عرض المادة (بيانات المادة الفوقية قابلة للعرض دائما)
    كتابة يمكن تعديل المادة
    الحزمة
    إضافة/ إزالة إضافة أو إزالة دفق البت إلى الحزمة
    دفق البت
    قراءة عرض دفق البت
    كتابة تعديل دفق البت

    لاحظ عدم وجود إجراء "حذف". لـ"حذف" مادة من الأرشيف، يجب أن يكون لديك صلاحية إزالة على كل المواد (في هذه الحالة، الحاوية) التي تحتوي هذه المادة. ويتم حذف المادة "اليتيمة" تلقائيا. يمكن تطبيق السياسات على الأشخاص الالكترونيين فرديا أو على مجموعات من الأشخاص الالكترونيين.




    مقاييس الاستخدام الرئيسية

    إن دي سبيس معد ببنية تحتية مبنية على SOLR لتسجيل وعرض الصفحات وتنزيلات الملفات.

    إحصائيات استخدام المادة، الحاوية والمجتمع

    يمكن استعادة إحصائيات الاستخدام من صفحات المادة المفردة، الحاوية والمجتمع. تقوم صفحات إحصائيات الاستخدام بعرض:

    1. إجمالي زيارات الصفحة (طول الوقت)
    2. إجمالي الزيارات شهرياً
    3. تنزيلات الملف (طول الوقت)*
    4. أعلى عروض في البلد (طول الوقت)
    5. أعلى عروض في المدينة (طول الوقت)
    6. * يتم عرض معلومات تنزيل الملفات للاحصائيات على مستوى المادة. لاحظ أنه يتم أيضا تسجيل التنزيلات من دفق بت منفصلة وتمثيلها بشكل منفصل. يستطيع دي سبيس التقاط وتخزين معلومات تنزيل الملفات، حتى عند تنزيل دفق البت من رابط مباشر من موقع ويب خارجي.

    إحصائيات النظام

    يمكن توليد العديد من التقارير الاحصائية حول محتويات واستخدام نظامك بواسطة النظام. حيث يتم توليدها عن طريق تحليل ملفات سجلات دي سبيس. يمكن تقسيم الاحصائيات شهرياً. يشمل التقرير على الاجراءات التالية:

    نظرة عامة على الأنشطة في الأرشيف، تشمل افتراضياً:
    1. عدد المواد المحفوظة
    2. عدد عروض دفق البت
    3. عدد عروض صفحة المادة
    4. عدد عروض صفحة الحاوية
    5. عدد عروض صفحة المجتمع
    6. عدد تسجيلات دخول المستخدم
    7. عدد الأبحاث التي تم إجرائها
    8. عدد الرخص التي تم رفضها
    9. عدد طلبات OAI
    10. ملخص قابل للتخصيص بمحتويات الأرشيف
    11. قائمة مقسمة بمرات عرض المادة
    12. تقسيم كامل لكل الإجراءات التي تمت
    13. تسجيل دخول المستخدم
    14. الأبحاث الأكثر شعبية
    15. معلومات مستوى التسجيل
    16. معالجة المعلومات! Stats_genrl_overview.png!
    17. يمكن تقديم نتائج التحليل الإحصائي في تقرير شهري وإجمالي، ومتاح عبر واجهة المستخدم. كما يمكن جعل التقارير عامة أو مقيدة لوصول المشرف فقط.



    الحفظ الرقمي

    فاحص تدقيق المجموع

    الغرض من الفاحص هو التحقق من أن المحتوى الموجود في مستودع دي سبيس لم يفسد أو يتم التلاعب به. يمكن استدعاء هذه الوظيفة على أساس ad-hoc من سطر الأمر، أو تهيئتها عبر الكرون أو ما شابه. توجد خيارات لدعم مستودعات ضخمة لا يمكن فحصها بشكل كامل في تشغيلة واحدة للأداة. الأداة قابلة للتوسع لمقاربات أولوية الفحص والتقرير.