いらっしゃいませ。 › フォーラム › Xrea のもの (Perlだった) › KanjiTranslatorとUTF-8化
- このトピックには4件の返信、2人の参加者があり、最後にりりにより12年、 3ヶ月前に更新されました。
-
投稿者投稿
-
-
2012年8月18日 7:11 AM #61りりゲスト
おはようございます。
ちょっと見損なっていたのですが、こちらにsugiyamaさまの貴重な体験談がありましたね。
スレッドに別の話題と混じっていましたので、新しく起こさせていただきました。>HTMLファイルは多量にあったので、 KanjiTranslatorというソフトでshift_jis→UTF-8に一括変換しました。
KanjiTranslator、さっそくTODOSお奨めフリーソフトに登録しました。
>メールフォームはhttp://www.synck.com/のを使っていましたが、
あっと、サイト全部UTF-8化するなら、WebPatio以外もいろいろ使っているので、メールフォームやバナーリンクや……かなりくじけますね…
>HTMLのテンプレートはありますが,書き込みデータはすべてlogにテキストデータで落ちてるようです。(Joyful Note について)
>本記事に「稼働中の掲示板では大変だと思う」と書いたときには,正直な話,頭の中にTODOSがありまして,あのくらいのスケールになると単なる変換でもかなり大変だろうと思っていました。気にかけていただいてありがとうございます。
多分、Joyful Note とは、手間暇がかなり違ってくると思います。WebPatioは、スレッドごとに独立したログがあります。それでスレッド一覧がソートできるのですね。その分、表示は、一つずつのスレッドだけなので軽く動作するのが売りのようです。
ですが、もう細かーく分かれたログが大量にあります…
あとJoyful Note にないものは、スレッド一覧用のデータです。
それは、カテゴリー数なので、今のところ、27こ分。ふぅー、その27こそれぞれにスレッド単位のログが数十個ずつあるんです…でも、KanjiTranslatorは、大量ファイルの文字コード一括変換ということで、なんとかなるかと思いますが、他のCGIも組み合わせていること…
ある程度準備(ミラーでそっくりUTF-8版を作り動作確認)したら、掲示板ログが増えないよう一時停止させて、移行するという手順が必要になるかな?多分、先に、他のCGI部分がUTF-8化できるかが問題になると思います。入り混じっていたら、混乱するでしょうし…
-
2012年8月18日 8:22 AM #62o6asanキーマスター
りりさん,おはようございます。
>> HTMLファイルは多量にあったので
と,sugiyamaさんもお書きのように,HTMLファイルにはKanjiTranslatorなどを利用できますが,他の部分はファイルの文字コードを変えるだけではだめですので,
> ミラーでそっくりUTF-8版を作り動作確認
> 他のCGI部分がUTF-8化できるかもし,TODOSをUTF-8化するという話になると,お書きのように上記は必須ですよね。
cgiスクリプトの場合,中に使われている文字がアスキーだけなら,ファイルそのものはエンコードし直す必要はありませんが,日本製のスクリプトの場合,コメント部分は大概日本語ですので,これが足を引っ張ります。>> あのくらいのスケールになると単なる変換でもかなり大変だろうと思っていました。
「単なる変換でも」と書いていますように,単なるデータの文字コード変換でも大変なのに,TODOSではそれだけでは済まないだろうという気持ちが入っています。
でも,単なる文字コード変換でも,量が多いと大変です。XSERVERはSSH(シェル)が使えるのですか。使えれば,少なくとも,ダウンロード・アップロードの手間は省けますが。サイトの文字コードがいろいろなのは,何かやるときの文字化けの原因ですよね。私の場合は,自宅サーバでしかもユーザが自分だけですから,文字コードはUTF-8だけに統一していますが,これがバラバラだと管理は結構面倒です。わからないなりに,サーバ管理者が読むようなところを読むこともあるのですが,昔からのサイトの運用で,結構文字コードで手を焼いているのをみます。
話はそれますが,今回,SSHの実験をやるのにTeraTermを使いました。一時期,TeraTermはすたれていました。SSH2に対応が遅れたのも原因ですが,UTF-8への未対応も原因のひとつです。
現在のTeraTermはSSH2にもUTF-8にも対応しています。それで,使うことにしたのですが―なんといっても日本発祥のソフトですし―もし今でも未対応だったら,採用しなかったです。
http://sourceforge.jp/projects/ttssh2/ -
2012年8月18日 9:20 AM #63りりゲスト
残念ながら
>>telenetやSSHは使えますか?
>申し訳ございませんが、ご利用いただけません。
というのが、よくある質問にありました。でも、いろいろとアドバイス、いつもながらありがとうございます。
-
2012年8月18日 10:03 AM #64o6asanキーマスター
>> 申し訳ございませんが、ご利用いただけません。
> というのが、よくある質問にありました。そうですか。いずれにしても,それは実際にやってみるときの話で,
> ミラーでそっくりUTF-8版を作り動作確認
> 他のCGI部分がUTF-8化できるかの話が先なのですが……
ところでちょっと調べていたら,こんなのがありました。XSERVERは使えたとの報告が入っています。
「SSH(シェル)が使えないレンタルサーバーには、PHP SHELLがおすすめ」
http://server-domain.info/2068.html説明されているPHP SHELLのバージョンが2.2なので,1年半くらい前の話のようです。したがって,今でも使えるかどうかは不明です。
使えたとしても,PHP SHELLでnkf(nkfもsourceforge.netのプロジェクトが活動中です。ありがたいです。)あたりが動かせるのかどうかもわかりませんが,それは別にしても,圧縮系の操作が使えれば助かります。回線速度はずいぶん速くなりましたが。
もっとも,上記の参照サイトにもありますように,サーバを管理する方から言うと,うかつに使われると怖い話なので,今は,完全に使えない設定になっている可能性も高いです。
-
2012年8月18日 2:40 PM #65りりゲスト
次々と情報ありがとうございます。
いずれにしろ、先の話なので、TODOSのサイト設営・運営のところにhttp://todos.xsrv.jp/22patioweb/todos.cgi?no=44
メモとして置かせていただきました。前にもお話ししていますが、私がTODOSのあの形を考えたのは、後からの参照のしやすさが一番です。
バナーリンクなどの動機もそうなのですが、私は、特定のパソコンにお気に入りサイトを登録して…ということをしません。
いつも複数台のパソコン利用を余儀なくされるので、ブラウザもメーラーも、自分好みに…ということをしません。基本は、どこでもそこにあるパソコンを使って…一般の方が買ったままのパソコンを使う状況と余り変えないということなのですね。ですから、どのパソコンからもWeb上で確認できるところに情報が分かりやすく整理してあると、とっても便利なのです。TODOSと検索に入れればすぐ出ますから、だいたいがそこからアクセスしています。
それで、他でも話題になったRSSやサイト更新チェックソフトには関心が向きません。できるだけWeb上で確認したいのです。いろいろな掲示板で、いろいろな話題が出ますが、どこで何が話題になったか、特定のパソコンに記録しておいても、そのパソコンを使っていないときは、困ってしまうのです。
で、リンク集など、自分が便利と思ったものは、個人のパソコンにではなく、Web上で紹介して皆様に共有していただければと思いました。
同様に、TODOS・情報交換掲示板も普遍的情報共有の場であるようにと願っています。そういう意味で、TODOSの各カテゴリーの話題やリンクシステムなど、ご遠慮なくo6asanさんにも今後ともご活用いただければと思います。
-
-
投稿者投稿
- トピック「KanjiTranslatorとUTF-8化」には新しい返信をつけることはできません。