最近の機械翻訳を使えば海外ネットサイトの情報収集はこんなに簡単
みなさん、こんにちは、Hiloyan(@HiloyanHiloker)です。今回は、海外のサイトからの情報収集についての話をしたいと思います。国内のWebサイトには、膨大な量の情報があるわけですが、IT業界の情報などのテクニカルなものは、海外にそのリソースがあることが多いものです。今日は私が日頃活用している方法についてご紹介したいと思います。
ここに挙げた方法については、あくまでもノウハウの共有が目的ですので、内容については、あくまでも自己責任の上で行うようにしてください。特に、権利上の問題などが書かれていた場合は、確認いただき、ご自身の責任と判断のもとで行うようにしてください。
海外には最新情報がいっぱい
今更ではありますが、IT系のエンジニアである私にとって海外のサイトにはたくさんの情報であふれています。また、国内の情報の中にも多くは海外のサイトの情報をもとに意訳をして国内に広めた2次情報のような加工情報も多いことから、必要に応じて元の情報を調べてみたくなることも多いものです。また、私の場合は海外の技術者のコミュニティに参加しており、その会誌やメールなどほとんどが英語だったりします。
一例をとると、AWS、Microsoft、Salesforeなどのクラウドや開発に関する情報や、NIST(米国国立標準技術研究所)や、CISA(サイバーセキュリティ・インフラストラクチャ・セキュリティ庁)、あるいはNCSC(英国国家サイバーセキュリティ・センター )などのレポートには、海外の最新の情報があり、これらの情報を探して活用することが出来れば、非常に役立つといえるでしょう。
また、こういったサイト以外であっても、CNNやBBCなどの各種ニュースサイトにも有用な情報がたくさんあります。最近でいうと、新型コロナウィルスの情報については、国内で集まる情報と海外で集まる情報は異なります。海外のサイトから日本のニュースをみると、国内のニュースで見るものとは少し異なった視点でニュースをみることが出来ます。このようにいろいろな角度で情報を集めることができれば、より客観的な角度で物事をとらえることが出来るでしょう。
英語の情報ってハードルが高い?
すでに述べたように、非常に有用な海外の情報なのですが、私たちが読むにはハードルが高いのです。これはいくつかの理由があるのかなと思います。
- コンテンツそのものが英語なので、ハードルが高い場合
海外のWebページに行くと、すべて英語なので、見ただけで圧倒される。 - 検索するにもどのように検索すればいいかわからない場合
そもそもGoogleとかで検索しても日本語で探している限りは英語の情報は出てこないので、探しづらい。 - PDFのような文書データで配布されている場合
海外のWebサイトを見ることが出来たとしても、データがPDFだったりすると機械翻訳にも一苦労してしまう。
それぞれについて私なりの解決方法をこれから説明していきますね。
コンテンツそのものが英語なので、ハードルが高い場合
海外のサイトはコンテンツそのものがすべて英語なので、これを読もうとすると圧倒されます。私の場合、こういった場合、私はブラウザの翻訳機能を使うようにしています。
これはいたって簡単です。EdgeブラウザやGoogle Chromeブラウザであれば、ブラウザにて右クリックをすると、「日本語で翻訳」という表示がされるので、そのまま選択すると、日本語に翻訳されます。
スマートフォンの場合もGoogle Chromeの場合は、英語サイトであることを検知して翻訳の選択ができるので、ここで、翻訳を選ぶことでWebサイトごと、日本語で表示されるようになります。
Safariの場合は、英語のコンテンツを範囲選択すると、「翻訳」というのが表示されるので、これを選択すれば、選択した範囲が日本語に翻訳されます。Safariの場合は、ほかのブラウザと比べると、サイトごと翻訳されるわけではないので、使いにくい部分はあるかもしれないでしょうが、これでなじみの日本語でニュースが読めるので大分印象も変わるのではないでしょうか。
実は、Safariで出てくる「翻訳」表示ですが、Kindleなどの電子書籍でも範囲選択することで表示されます。英語の書籍を読む場合も、この機能を使うことによってかなり敷居が低くなるのではないでしょうか。
検索するにもどのように検索すればいいかわからない場合
検索するにもどのように検索すればいいかわからない場合についてですが、結構使えるのが、ここはケースバイケースだったりします。
一般的な情報なのであれば、前述のニュースサイト(CNN、BBC、CBC、ABCなど)を足掛かりに見ていくのがいいと思います。日本で見ている / 聞いている情報とは少し異なる軸で見ている情報を手に入れることができるので、結構新鮮な体験をすることが出来ると思います。
テクニカルな情報については大まかには、企業名(Microsoft,Amazon Web Service、Oracle、Salesforceなど)、規格名(ISO系とか)、認証名(ITILとか)などを足掛かりに探していくとたどることが出来ます。ここら辺は、探したい業界によって、キーワードも異なってくるのでヒント位までにとどめておきます。
一回関連する情報が引っかかったら、ページの最後にある参考情報についてもチェックしておきましょう。元ネタについて目を通すことで理解が深まりますし、キーワードについても集めることが出来ます。必要に応じてブックマークをしておき、後から見に行けるようにすることも必要と思います。
PDFのような文書データで配布されている場合
これは、あまり難しいことではありません。PDFのような文書データはいったんダウンロードしてしまいます。このデータをGoogle翻訳のドキュメントを選択し、アップロードすることによって翻訳は可能です。この場合、いくつか注意しているのは、PDFについては、Web上の誰でもダウンロードできるものであればいいのですが、特定の人だけに公開されているとか、権利についての記述があって、第3者へ渡すことについての問題があると記載されている場合がありますので、注意してください。
公開ページでそのようなことに出会うことはあまりないと思いますが、くれぐれも注意の上、自己責任の上で行うようにしてください。
最後に
いかがでしたでしょうか。あまり込み入ったテクニックなどは使っていないので、日頃からGoogle 翻訳や、Deeplを使いこなされているかたにとっては少し物足りないところもあったかと思います。機会があればこれらのツールを活用した応用についても記事にしていければと思います。