February 2010
- Feb 24
- Feb 23dltjEAD and MARC sitting in a tree: D-R-U-P-A-L
# EAD and MARC sitting in a tree: D-R-U-P-A-L Mark Matienzo Yale University Library (ex-New York Public Library)
# background: migration/redeployment
# launched new site January 6: www.nypl.org
# components: Drupal, XSLT, Solr, Shrew
# browse/search/view: http://www.nypl.org/find-archival-materials
# drupal-shrew: liberating yr data from III http://github.com/anarchivist/drupal-shrew
# III into Drupal...
# ...to the rest of the world - Feb 23dltjMarcXimiL - bibliographic similarity analysis
MarcXimiL is a free, flexible, fully standards-compliant and efficient bibliographic similarity analysis framework.
Similarity analyses may be set up at all levels of the process, run in batch or through the API. Options include:
* the order of comparisons between and within collections
* for each field, the selection of a parsing function
* for each field, the selection of a comparison function amongst a wide selection: vectorial (Dice, Jaccard, Salton's cosine), probabilistic (OKAPI BM25), Levenshtein based, Shingling, Authors, Date, and others.
* the global record similarity strategy (integration of fields similarities)
* the output format (XML, spreadsheet)
* thresholds at different levels - Feb 23dltjMatching Dirty Data
A description of a method for matching bibliographic records when the only common identifiers are strings that are not exact matches.
- Feb 08
January 2010
- Jan 28
- Jan 28
- Jan 28
- Jan 25
- Jan 20
- Jan 09
December 2009
- Dec 15
- Dec 15
- Dec 15
- Dec 14
- Dec 13myungdae.cho정보검색 시 FRBR 방식의 디스플레이가 이용자의 분산된 인지(認知)에 미치는 영향에 관한 질적인 연구 - Myungdae Cho님이 작성한 놀
기존 MARC시스템은 서지사항을 기술하는 데에는 필요한 다양한 기능을 지니고 있는 메타데이터임은 분명하나, 서로 연관이 있는 자원들을 연결시키는 데에는 한계점을 들어내고 있다. 이에 ‘정보객체’와 ‘객체들 간의 관계’ 속에서 검색을 원하는 다양한 이용자들의 다양한 정보 요구에 부응할 수 있는 시맨틱 서지모델이 필요하다. 이런 요구에 부응하여 개발된 FRBR 모델에서는 기존의 flat한 MARC의 구조를 개체-관계(entity relationship) 모델을 활용하여 표현함으로써 이용자들이 검색해 나감직한 방법에 맞게 논리적인 순서를 제공해보자는 시도를 하고 있다. 이것은 지금 시맨틱웹에서 시도하고 있는 ‘문서의 연결’ 보다는 ‘데이터 위주의 연결’이라는 패러다임과 맥을 같이 하고 있다. 그러나, 이러한 시도에 대해서 과연 이용자들이 그렇게 활용을 하고 있을까라는 질문을 포함한 이용자들의 검색형태에 대한 진정한 의미에서의 이용자중심의 인지적인 연구가 없었다는 점에서 본연구가 시작되었다. 따라서, 본 논문에서는 FRBR방식의 디스플레이가 이용자들의 인지확장에 어떻게 영향을 끼치는 가를 질적으로 밝히고 있다. 그 평가 대상은 MARC 및 FRBR가 가지고 있는 장점을 접목시켜서 기존의 전통적인 도서관 목록을 이용자의 실제 검색패턴에 맞게 노력한 FictionFinder라는 OCLC에서 개발한 prototype를 가지고 “과연 그들이 의도하는 대로 이용자들이 그렇게 이용을 하던가?”라는 의문 및 또 있을 수 있는 다른 가치 및 문제점을 찾아내보고자 했다.
- Dec 09dltjSimple MARC Manipulation Using XSLT | Index Data
I really like the idea of using XSLT to manipulate MARC data -- it's not a perfect translation language, to be sure, but it's a standard, which means it gives us a shared language. We can share tricks, patterns, and entire stylesheets for different purposes, from data conversion to display formatting, and high-performance XSLT processors can be embedded into just about any kind of software platform. The LoC makes a few nice, reusable stylesheets available for MARCXML work -- it would be nice to see something like that evolve into a public repository of stylesheets.
- Dec 01dltjFunctional Analysis of MARC 21 (Library of Congress)
Introduction and Extending Mapping; Table 1: Composite table: Mapping MARC Data Elements to FRBR and User Tasks; Table 2: Mapping of FRBR to MARC Data Elements; Table 3: Mapping of MARC Data Elements to FRBR; Table 4: Mapping of Record Processing Entities and Attributes to MARC Data Elements
- Dec 01steventatum52240MARC Code List: Relator Codes -- Code Sequence
roles: e.g., artist, architect, author of dialog
November 2009
- Nov 29

