理系にゅーす

理系に関する情報を発信! 理系とあるものの文系理系関係なく気になったものを紹介します!

アルゴリズム

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/07/06(土) 02:34:22.48 ID:CAP_USER
「非再帰的ZIP爆弾」は10MBのファイルが281TBに膨らむ
https://gigazine.net/news/20190705-zip-bomb/
2019/7/5
GIGAZINE

画像:
https://i.gzn.jp/img/2019/07/05/zip-bomb/01.png


数十KBのZIPファイルに見えて解凍すると膨大なファイル容量を食う「ZIP爆弾(高圧縮ファイル爆弾)」は、ZIPファイルの中にZIPファイルを格納し、内側のZIPファイルの中にさらにZIPファイルが……という入れ子構造を用いることで圧縮アルゴリズムの限界をうまく回避していますが、それゆえに多くのアンチウイルスソフトで対策されています。この弱点を乗り越えた「非再帰的ZIP爆弾」は、展開後のサイズこそ高効率で作られた再帰的ZIP爆弾にかなわないものの、わずか10MBから281TBへ2800万倍に膨らみます。

ZIPの圧縮で一般的に用いられているアルゴリズムは「Deflate(デフレート)」と呼ばれるもので、圧縮・展開速度の速さが特徴的です。圧縮率が最高で1032:1(約0.096%)という点はZIP爆弾を作る際の「足かせ」となっており、この制限を回避するため、ZIP爆弾ではZIPファイル内にZIPファイルを格納する入れ子構造を利用して、入れ子1つごとに1032倍にできるだけ近い圧縮率を得ることで、巨大ファイルを極小に見せています。

たとえば、有名なZIP爆弾に「42.zip」というファイルがあります。このZIPファイルは2種類存在して、古いバージョンは展開時のパスが不要でファイルサイズが「42,374バイト」、新しいバージョンは展開時にパスが必要でファイルサイズが「42,838バイト」。以下は古いバージョンのプロパティです。

中をのぞいてみると「lib 0.zip」から「lib f.zip」まで連番のつけられた16個のZIPファイルが格納されています。ファイルの元サイズは34,902バイト(35KB)で、圧縮後は2,533バイト(2.6KB)。圧縮率は7.3%。

「lib 0.zip」には、さらに「book 0.zip」から「book f.zip」というZIPファイルがあります。こちらは元サイズが29,446バイト(30KB)、圧縮後が2,084バイト(2.1KB)で、圧縮率7.1%。

続きはソースで
ダウンロード (2)


引用元: 【IT/ウィルス】「非再帰的ZIP爆弾」は10MBのファイルが281TBに膨らむ[07/06]

「非再帰的ZIP爆弾」は10MBのファイルが281TBに膨らむの続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/06/09(日) 08:37:14.21 ID:CAP_USER
10ドル足らずの費用でAIに国連総会の偽スピーチを書かせることができる
https://jp.techcrunch.com/2019/06/08/2019-06-07-for-less-than-10-anyone-can-make-an-ai-write-a-fake-un-speech/
2019年6月08日
TechCrunch

画像:偽の国連スピーチを作り出すために使ったAI実験の結果
https://techcrunch.com/wp-content/uploads/2019/06/Screen-Shot-2019-06-07-at-8.04.00-AM.png

 国連の研究員たちが、わずか8ドル足らずの費用とMLモデルの13時間の訓練により、国連総会のスピーチのそっくりさんを作るプログラムを開発した。

 MITのTechnology Reviewに載ったその研究は、これもまた、今がディープフェイク(deepfake)の時代であることを示唆する例の一つであり、テキストの贋作がビデオの贋作に劣らぬ脅威でありうることを示している。
 簡単安価に作れるから、ビデオよりも始末に負えないかもしれない。

 研究員のJoseph BullockとMiguel Luengo-Orozは、1970年から2015年までの間に国連総会で行われた政治家たちのスピーチの、英語による書き起こしを使って、
 機械学習のアルゴリズムのためのタクソノミー(分類集)を作った。

 その目標は、気候変動やテロなどさまざまな話題に関するスピーチの形をしたテキストを生成できる、言語モデルを訓練することだった。

 彼らのソフトウェアは、タイトルとなる話題のあるセンテンスを一つか二つ与えるだけで、一つの話題につき50から100ワードのテキストを生成できた。

 目標は、一般的な話題でも、あるいは国連事務総長が行った特定の声明でも、それらをもとに本物そっくりのスピーチを作れることを示すこと。
 そして最終的には、そのソフトウェアが政治的に微妙な話題に関してはスピーチに脱線(主題からの逸脱)を含めることができるか、確認することだった。

 やや安心できるのは、一般的で抽象的な主題ほど、アルゴリズムは良い仕事をしたことだ。

続きはソースで

ダウンロード (2)

引用元: 【AI】10ドル足らずの費用でAIに国連総会のスピーチ(のそっくりさん)を書かせることができる[06/08]

10ドル足らずの費用でAIに国連総会のスピーチ(のそっくりさん)を書かせることができるの続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/04/18(木) 16:18:47.03 ID:CAP_USER
世界最強の囲碁AI(人工知能)開発と若手棋士育成を目標にする「GLOBISーAQZ」プロジェクトが、4月18日に発表された。ビジネススクールを展開するグロービス、囲碁AI「AQ」開発者の山口祐さん、日本のプロ棋士を統括する団体の日本棋院、囲碁AI「Raynz」を開発したベンチャー企業のトリプルアイズの4者が共同で進める。プロ棋士の大橋拓文六段がテクニカル・アドバイザーを務める。

 囲碁の若手棋士育成と、AIの研究開発を発展させるため、2018年9月に発足したプロジェクト。山口さんが開発した「AQ」をベースに、囲碁AIの思考アルゴリズムとAIの強化学習の手法を開発。試行錯誤を通じて最大限の結果を出せるようにする。産業技術総合研究所や、AIの研究開発で知られる東京大学・松尾研究室も技術面で支援する。

 トリプルアイズは強化学習におけるレーティング結果の計測と可視化を、グロービスはAIの強化学習に向けた大規模演算のためのインフラ構築と最適化を担う。

続きはソースで

https://image.itmedia.co.jp/news/articles/1904/18/mm_igoai01.jpg
https://image.itmedia.co.jp/news/articles/1904/18/mm_igoai02.jpg

https://www.itmedia.co.jp/news/articles/1904/18/news064.html
ダウンロード (2)


引用元: 【AI】「囲碁AIの世界一目指す」 日本棋院、AIベンチャーらが共同プロジェクト「GLOBIS-AQZ」発表[04/18]

「囲碁AIの世界一目指す」 日本棋院、AIベンチャーらが共同プロジェクト「GLOBIS-AQZ」発表の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/03/26(火) 15:44:41.18 ID:CAP_USER
英国の国家統計局(ONS)が2017年、2000万人の仕事を分析した結果、そのうちの7.4% はテクノロジーに取って代わられる危険性が高いことが分かった。

ONSの発表によれば、もっとも「危険にさらされている」グループは、女性、パートタイマー、若者だった。また、自動化される可能性がもっとも高い仕事は、接客係、次いで商品の棚積み、若い営業職であり、その一方で、可能性がもっとも低い職種は医師と教師だとしている。ONSは人々がこの調査結果について議論できるように、チャットボットを開発した(まったくもって皮肉な話だ)。

ロボットに仕事を奪われるかといえば、必ずしもそうではない。ONSは「定型的な反復作業ほど、人間が作成したアルゴリズム、すなわち特定の機能に特化して設計された機械の方が、より迅速かつ効率的に職務を遂行できる」としている。ONSの調査結果は同種の他の研究とも一致している。

続きはソースで

https://cdn.technologyreview.jp/wp-content/uploads/sites/2/2019/03/26053105/waiter-chuttersnap-unsplash.jpg

https://www.technologyreview.jp/nl/1-5-million-jobs-in-the-uk-are-at-high-risk-of-being-automated/
ダウンロード (6)


引用元: 【AI/4IR】160万人が影響?英政府が発表した、自動化で「なくなる」仕事[03/26]

【AI/4IR】160万人が影響?英政府が発表した、自動化で「なくなる」仕事の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/02/06(水) 13:23:22.03 ID:CAP_USER
ディー・エヌ・エーと関西電力は2月5日、石炭火力発電所における燃料運用のスケジュール作成をAI(人工知能)で自動化するシステムを共同開発し、外販に向けて協業を進めると発表した。
http://image.itmedia.co.jp/news/articles/1902/06/kansai_01.jpg

 石炭火力発電所では、輸送船から受け入れた石炭を「バース」と呼ばれる設備で受け入れて「サイロ」で貯蔵、その後「ボイラ」で石炭を燃焼して電力を生み出す。しかし、石炭の組み合わせによっては一緒に積めなかったり、燃やせなかったりする場合があった。

 これまでは、熟練技術者がそうした制約を考慮して燃料関係設備の運用スケジュールを作成していたが・・・

続きはソースで

http://image.itmedia.co.jp/news/articles/1902/06/kansai_02.jpg

ITmedia NEWS
http://www.itmedia.co.jp/news/articles/1902/06/news086.html
ダウンロード (8)


引用元: 【AI】ゲームAIの手法、火力発電所システムに応用 DeNAと関電が共同開発

ゲームAIの手法、火力発電所システムに応用 DeNAと関電が共同開発の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/02/14(木) 16:00:39.94 ID:CAP_USER
アマゾンで買い物をするとき、購入したサービスや商品の価格を設定したのは、おそらく人間ではなくアルゴリズムだ。自動化システムがますます手ごろで簡単に実装できるようになるにつれ、価格設定アルゴリズムはあらゆるオンライン販売で使われるようになってきた。

航空会社やホテルは長らく機械を使って価格を設定してきたが、価格設定システムは進化しており、ルール・ベースのプログラムから強化学習ベースのプログラムへと移行し、価格を決定するロジックはもはや人間がコントロールするものではなくなった。

強化学習はAI(人工知能)エージェントに対し、特定の目標に向けて罰と報酬を使って動機付けする機械学習のサブセットである。アルファ碁(AlphaGo)が、囲碁で最強の棋士を打ち破るのに強化学習を使ったのは有名だ。価格設定システムは、たとえば、全体的な利益を最大化するなどの目標を与えられ、その後、シミュレーション環境でさまざまな戦略を実験し、最適な戦略を見付ける。だが、 ある新しい論文では、このシステムが大きな問題を起こす可能性を指摘している。

続きはソースで

https://cdn.technologyreview.jp/wp-content/uploads/sites/2/2019/02/13030511/amazon-1400x787.png

https://www.technologyreview.jp/nl/pricing-algorithms-can-learn-to-collude-with-each-other-to-raise-prices/
ダウンロード (3)


引用元: 【AI】アマゾンの強化学習ベースの価格設定アルゴリズムが「談合」まで学習してしまう[02/14]

アマゾンの強化学習ベースの価格設定アルゴリズムが「談合」まで学習してしまうの続きを読む

このページのトップヘ