「社会学文献情報データベース」は、多言語処理が容易な文字コードである Unicode への対応を進めてています。新検索サイトでは、Unicode に対応しています。
コンピュータ上での多言語処理を容易にすることを目指して米国の情報関連企業が中心となって提唱した文字コード体系で、1993年に国際標準化機構(ISO)において ISO/IEC 10646 として規定されました。言語の違いに関わらず、一つの文字コード体系によって多言語処理を行おうとしたところに特徴があり、世界の主要な言語で使用するほとんどの文字が収録されています。その後、Unicodeを内部コードとする基本ソフトの開発が進み、多くの応用ソフトがUnicodeに対応するなど、現在コンピュータで文字情報を扱う際、Unicodeが中心的な文字コード体系となっています。
Unicodeが開発される以前から、各国では、その国で使用する言語をコンピュータ上で処理するために、各国独自の文字コード体系を築いてきました。日本においては、日本工業規格において JIS X 0208 として規定された文字コード体系(JIS第1水準、第2水準漢字など)がコンピュータにおいて標準的に使用されてきており、「社会学文献情報データベース」も使用する文字はこの規格に基づいて作成してきました(エンコード形式としては、Shift_JIS を採用)。しかしながら、JIS X 0208 では、人名などで一部使用できない漢字があること、フランス語のアクサン符号付きの文字、ドイツ語のウムラウト付きの文字など、特殊なラテン文字が使用できないなど、従来のデータベース構築において問題となってきました。確かに、「社会学文献情報データベース」は、日本の社会学文献の書誌情報を収録するデータベースですので、多言語対応が必要な部分はそれほど多くはありません。しかしながら、欧文標題名でフランス語、ドイツ語等を使用する文献が存在すること、また日本の社会学の国際化が進展する中でさまざまな言語への/からの翻訳文献(特に中国語や韓国語)にも対応が必要となってきています。
日本において従来使用できなかった漢字は、その後 JIS X 0212(補助漢字)、JIS X 0213(第3水準、第4水準)として規格化され、これらのコンピュータへの実装が、Unicodeベースで広がる中、ISO/IEC 10646は、日本においても2001年に JIS X 0221 として規格化されました。Unicodeに対応することによって、上述した問題を一挙に解決することができるとともに、パーソナル・コンピュータでの対応が進む中、Web登録システムにおいて、申請者が意識することなく、既に入力が行われるケースが多数存在しており、「社会学文献情報データベース」でも順次対応を進めているところです。
Unicode に対応することによって、具体的に次のようなことができるようになります。
「社会学文献情報データベース」の検索・登録・修正システムは、順次Unicode(UTF-8)をベースとするように準備を進めているところですが、一般に利用されているパーソナル・コンピュータの OS や Webブラウザでは、既に Unicode に対応していますので、特に利用者側で必要なことはありません。ただし、お使いの環境によっては、CJK統合漢字拡張A,B に定義される漢字など、一部の文字を表示できない場合があります。
2008年1月現在、文献情報の登録システムは、まだUnicodeベースではありませんが、データは自動的にエンコードされて保存されますので、お手元のパーソナル・コンピュータ等で、必要な文字を入力していただいて結構です。
Unicode は、元来、世界中の言語で使用する主要な文字を16ビット(256×256=65536通り)の空間の中で定義する計画でしたが、多方面からの収録文字の追加要求の結果、16ビットの空間の中では収まらないことになり、拡張を行った結果、一部で32ビットでの定義が含まれるコード体系となりました。例えば、JIS X 0213 で定義される漢字(JIS 第3水準、第4水準)の一部は、拡張領域に位置づけられています。
これらの拡張領域については、一部のソフトウェアが未対応であり、完全な対応ができない場合があります。
「社会学文献情報データベース」では、必要に応じて、従来の Shift_JIS の形式に変換したヴァージョンを作成します。変換の際は、アクサンやウムラウトの付いた文字は付いていない文字に、使用できない漢字等の文字は、代替する別の文字に変換するか、代替する文字がない場合には「〓」に変換します。日本人名の漢字の場合は、代替する適切な文字がない場合は、該当部分を平仮名書きします。
東北大学サイトの検索サービス、および国立情報学研究所の学術研究データベースリポジトリにおいて公開しているものは、こうして作成した Shift_JIS 版を使用しています。
本ページの執筆者:周藤 真也(日本社会学会データベース委員)