831555


1: 2020/08/08(土) 09:44:19.76 _USER

人のゲノムには無数の遺伝子が含まれており、DNAとRNAの微妙な組み合わせがひとりひとりにユニークな特徴を与えています。ゲノム解析の研究者らは、これら遺伝子のひとつひとつに記号と英数字を組み合わせたコードで名前をつけ、分別して研究に役立てています。

とことが、ここ最近の解析で付与された遺伝子の"名前"は、非常に扱いにくいことで問題となりました。なぜなら、マイクロソフトの表計算ソフトExcelが、これら遺伝子の名前を入力したセルを勝手に日付だと勘違いするから。

Excelの自動書式設定機能は、日付を簡単に入力できるようにデフォルト設定されており、たとえば”12/1”と入力すれば12割る1ではなく、12月1日に変換します。国際ヒトゲノム解析機構(HUGO)のなかのゲノム命名法委員会(HGNC)の人たちが困ってしまったのは、遺伝子に付けられた名前”Membrane Associated Ring-CH-Type Finger 1”の略称” MARCH1 ”をExcelに入力すると、勝手に”3月1日”に変換されてしまう現象でした。

厄介なことに、マイクロソフトはこの自動変換をオフにする設定項目を用意していません。

同様の変換によって日付になってしまう遺伝子は多数あり、2016年に発表された遺伝学関連論文の約1/5にExcelの自動変換機能が影響を与えていたとされます。そしてHGNCではこのようなエラーの発生を防止するため、過去1年間で合計27個の遺伝子の名前を変えてきたとのこと。例を挙げるなら、” MARCH1 ”という記号を” MARCHF1 ”に、” SEPT1 ”を” SEPTIN1 ”に、といった具合。しかし、まだ自動変換にひっかかるすべての名前を変更し終わったわけではありません。

これまでにも一度つけられた遺伝子の名前が変更された例はあるものの、それらは検索時に誤検出を起こしたり、その名称が特定の人々に懸念を抱かせるようなものだったりしたため。今回のようにたまたま使っているアプリケーションソフトの標準機能のせいで名称を変えるという例は少なくともいままではありませんでした。

科学者であれど当たり前に使用するExcelですが、アプリケーションとしてはより一般的な用途に向けて設計されていることから、マイクロソフトが今回のような特定の分野の問題のためにパッチなどを用意することはなさそうな雰囲気。HGNCのコーディネーターであるElspeth Bruford氏もこの問題は「非常に限られた使用例」であり、書式の自動変換を無効化するオプションはごく一部の人たちの助けにしかならないと述べました。

ところで、Excelはセル内容の自動変換をオフにする設定項目は用意していませんが、入力する文字列の最初にシングルクォーテーションを入れれば、以降の値を文字列として処理するルールがあります。たとえば” MARCH1 ”なら、” ’MARCH1 ”と入力すれば、それは問題なく文字列として扱われるはずなのですが…?おそらくは、それでも解決できない特殊な不具合があったのでしょう。きっとそうに違いありません。

https://japanese.engadget.com/rename-genes-due-to-excel-043027343.html


5: 2020/08/08(土) 09:52:22.95

>>1
>以降の値を文字列として処理するルールがあります。たとえば” MARCH1 ”なら、” ’MARCH1 ”と入力すれば、それは問題なく文字列として扱われるはずなのです
数字とコードの区別もしてもらえず 0始まりコードも改竄され迷惑
セルの書式設定で標準>>文字列にしておく


32: 2020/08/08(土) 10:43:28.12

>>13
excelの使い方っていうパソコンの大先生レベルでドヤっちゃう男の人つて(笑)


65: 2020/08/08(土) 12:16:45.23

>>1
記事にはシングルコーテーションと書きながら、「"」ダブルで書かれてるのだが、どちらでもいいのか?


91: 2020/08/08(土) 15:06:45.46

>>65
文章中で値を明示する時とか強調する時に "ダブルクォーテーション" で囲うんだよ
当然入力時にはダブルクォーテーションを除いて入力する
あとシングルクォーテーションを全角で書いてるのはこんな風に "'わかりにくくなる" からだと思う
実際の入力時は半角シングルクォーテーションで入力する必要がある


68: 2020/08/08(土) 12:31:10.59

>>1
あたまに「'」を付けるとそのセルの値を文字列と認識してくれるぞ
当然数値計算はできなくなる


74: 2020/08/08(土) 13:07:18.85

>>1
> 科学者であれど当たり前に使用するExcel

ないわー。
文書作るのにWordってのはまだありだが、
表計算ソフトは無用の長物。
プレーンテキストとシェルスクリプト、awk,sed,grep辺り駆使した方が
楽だし幅広く応用が効く。


77: 2020/08/08(土) 13:37:20.05

>>74
>awk,sed,grep辺り駆使した方が

どんな分野の科学者にいいの?
文字列処理メイン?だったらかなり狭くない?


92: 2020/08/08(土) 15:09:42.48

>>77
それで済まない領域ならPythonとか使えばデータ処理も楽々ですよ
データの数が数千件を超えるならSQLite3とかのDB入れればいい


105: 2020/08/08(土) 15:58:58.15

>>92
大量なデータの演算処理には、やっぱそうなるんだろうか。
ただExcelという、広く流通しているデータ・フォーマットと
アプリでできることは、なるべく完結させてやりたい。
別のものを付加してまでどれだけメリットがあるか確信ないと。

先ず表計算ソフト(スプレッドシートスタイル)が、これまでも
今後も廃れないだろうことは、入力や出力のデータを数表やグラフ
の形で閲覧できるUIとして普遍的と思われるから、容易に想像可。
そして表計算ソフトのデファクトスタンダードになっているExcelは、
その機能やワークシート関数やマクロの豊かさが功奏して、UIとして
のみならず、演算処理も大概のことができ、つまり完結できるわけで。

ExcelにPythonが搭載されたら、鬼に金棒らしいけど、
具体的にどんなメリットがあるんやら(例えば高速化?)。


2: 2020/08/08(土) 09:45:31.11

EXCELじゃなきゃいいんじゃないかなぁ


4: 2020/08/08(土) 09:49:52.05

>入力する文字列の最初にシングルクォーテーションを入れれば、以降の値を文字列として処理するルールがあります

解決しとるやんけ


6: 2020/08/08(土) 09:54:26.72

excelが完璧すぎるとwordさんが死ぬから仕方ないね

>>4
しとらんやろがい


99: 2020/08/08(土) 15:29:20.63

>>4
シングルクォーテーションを使うやり方では、見落としが生じやすく、後々、
混乱を招くから、あえて、明確に名前を変えることを選んだのだと思う。


9: 2020/08/08(土) 10:06:21.37

セルの書式をテキストにしておくのはだめなの?


10: 2020/08/08(土) 10:07:59.69

シングルクォーテーションも入れる必要ねーよw
セルのフォーマットを「テキスト」に設定すれば、内容の勝手な変更はされなくなる。

自分であれこれ解決策を探しても分からなかったとしても、
ぐぐればすぐに答えが見つかるぞ。
学者さんなら、それくらいの工夫はしろや。


18: 2020/08/08(土) 10:21:30.46

>>10
実際それでやってみ。ちょっとコピーとか移動するだけで、すべて破綻するから。


174: 2020/08/09(日) 09:29:38.29

>>10 >>18
セルの書式設定(セル書式設定窓)ではなく
セルのスタイルの編集(スタイル窓)ならできるけどね
アイコンは何処にあるかな?
┐(´∀`)┌ やれやれ


175: 2020/08/09(日) 09:37:54.26

>>174
できるできないの問題ではないんだよ


176: 2020/08/09(日) 09:45:41.73

>>175
エクセルは汎用ソフトつまりアプリケーションソフトウェア
にイチャモン付ける方が間違いで運用でカバーするしかない
用途に合わないなら専用ソフトを購入するしかないんだよ


12: 2020/08/08(土) 10:15:38.60

Excelの効率の悪さといったら・・・


15: 2020/08/08(土) 10:19:31.93

> Excelの自動書式設定機能は

こういうのすごい邪魔。CSVインポートの時とか特に面倒臭い。


20: 2020/08/08(土) 10:21:45.30

>>15
CSVとかマジで面倒だよな
勝手に頭の0を省いて数値型に変換するし


21: 2020/08/08(土) 10:23:06.54

>>15
そうそう、CSVでインポートする手前で ’ 入れるツール作る羽目になる。
しかも ’  入れたところでちょっと操作するだけで破綻する
Excelは人類を破滅に導くクソツール


26: 2020/08/08(土) 10:29:29.10

>>21
そもそも仕様の曖昧なCSVを現代でも使うなと。


40: 2020/08/08(土) 10:52:49.99

>>15
全書式を文字列にしたテンプレートを作って、初期テンプレートに指定すれば余裕


112: 2020/08/08(土) 16:53:01.18

>>15
そういうのは昔はSEDとかAWKとかで前処理したんやで


16: 2020/08/08(土) 10:19:51.74

大抵の文章はWordよりExcelで作ったほうが手っ取り早い


28: 2020/08/08(土) 10:32:15.43

自動書式のようなユーザインタフェースと、データベースとしての機能が同居してる時点で、そもそも業務向きではない
設計思想からして何もかも間違っている


29: 2020/08/08(土) 10:33:15.78

LibreOfficeでも起こる現象なの?


30: 2020/08/08(土) 10:37:38.87

EXCELは便利だからまあ


44: 2020/08/08(土) 10:57:41.91

>>30
便利というより知名度だな。
Excelって言っておけば誰にでも通じるから。


37: 2020/08/08(土) 10:52:04.15

自動変換無効化と
語彙のアルゴリズム取っ払ったら

パソコンの入力速度を上げるしかないと思うけど、めんどくさいよね。
多分・・・そこまで、訓練する人もいないだろうし。
それでいいんでないの?


38: 2020/08/08(土) 10:52:06.14

>2016年に発表された遺伝学関連論文の約1/5に
>Excelの自動変換機能が影響を与えていたとされます。

それはそれで凄い話だ


39: 2020/08/08(土) 10:52:28.68

自動変換をオフにする設定項目が無い?
データの型を日付から文字列にするだけじゃねーの?


41: 2020/08/08(土) 10:53:22.05

データ解析とか他のソフトで生成したデータを
エクセルに移すときに面倒が増えるわけだな


42: 2020/08/08(土) 10:54:00.83

本当にクソ仕様なのは
年月日に誤変換された文字を書式設定で文字列にしたら数列に変換されることだろ


43: 2020/08/08(土) 10:55:16.31

データベースにインポートしたい時はエクセルはデータ型曖昧だから面倒なんだよな


45: 2020/08/08(土) 10:57:50.57

日本のExcel方眼紙問題どうなったかな


47: 2020/08/08(土) 10:59:49.76

~すれば?っていうのを科学者全員に要求するのが無理なんだよ。
遺伝子のことで頭が一杯でさ。


52: 2020/08/08(土) 11:09:41.40

何人かの人も言ってるけど、
セルの書式を文字列に変えることで
解決する話なんでないの?


70: 2020/08/08(土) 12:44:55.51

>>52
その通りなんですが、CSVで吐き出した遺伝子名一覧とかを、他の科学者に公開することもあるので。
解析した人間が理解してても、受け取った共同研究者なりが
無邪気にexcelで開いて、そのexcelバージョンを
データとして登録するとか、良くあります。


84: 2020/08/08(土) 14:10:08.88

>>70
あー!そういうことですか!
確かにありますね!

自分は.から始まる数値データを勝手に
「0.nn」みたいに頭に0つけられましたわ、、。


53: 2020/08/08(土) 11:17:21.35

弥生って名付けるか
LibreOfficeで良いじゃん


58: 2020/08/08(土) 11:31:57.59

そういうドキュメント作るたびに毎回毎回毎回毎回設定してチェックするという
生産性のない作業を繰り返すのは、勤勉な愚か者だけで十分ということです


61: 2020/08/08(土) 11:51:40.66

エクセルの迷惑な優しさ


63: 2020/08/08(土) 12:01:49.64

>マイクロソフトはこの自動変換をオフにする設定項目を用意していません。

どんだけクソ仕様なんだよ・・・


67: 2020/08/08(土) 12:30:53.51

なんでそんな仕打ちまで受けながらexcelを使うんだ?


69: 2020/08/08(土) 12:43:33.44

すげーよく分かる
csvでデータを渡すと「なんか日付が変だよ」とか言われて、見ると勝手に変換とか良くある

まあでも、今となっては、xlsxでやりとりしてWindows以外の人で困るのは、印刷の時くらいだよね


72: 2020/08/08(土) 13:05:14.79

確かに日付変換機能は煩わしく思った事あるだろ?


73: 2020/08/08(土) 13:05:18.72

一太郎使えよ
埼玉県庁の申請書類はジャストシステム


76: 2020/08/08(土) 13:18:51.79

wardで論文書くと図表番号がずれて意味不明になるぞ


80: 2020/08/08(土) 13:47:50.52

エクセルを使わないという選択肢が無い不思議さ


93: 2020/08/08(土) 15:12:12.61

>>80
普通の会社で働いたらわかると思うよ
って研究者の話だよな
その世界でもExcelって浸透してるんだな、ちょっとびっくり


82: 2020/08/08(土) 14:02:33.00

cvsをexcelで開くとテンプレートが効かない罠


83: 2020/08/08(土) 14:08:14.51

>> マイクロソフトはこの自動変換をオフにする設定項目を用意していません。


マイクロソフトがこの設定機能パッチで緊急に追加するのがスジだと思う。


85: 2020/08/08(土) 14:20:55.70

csvを作るためのインターフェイスとしてだけはexcelって優秀だと思う。


87: 2020/08/08(土) 14:22:54.95

>>85
csv専門のエディタあるけど、
Excelほど機能が充実してないし、
操作も慣れてるExcelの方が良い、
となりますからねえ


86: 2020/08/08(土) 14:22:27.84

解決方法は色々あるけど、誤認識されないデータの方が捗るだろうな


97: 2020/08/08(土) 15:17:28.65

wordのお節介機能も大嫌い


100: 2020/08/08(土) 15:33:36.52

オフにできるだろw
文字列セルに変更すりゃ大丈夫なはず


113: 2020/08/08(土) 17:01:42.96

>>100
Excelで作ったデータを他の人と共有するためにCSVで出力したとする。
そのCSVデータをExcelで開くとmarch1のようなデータが日付に替わってしまう。
そこで気づいた人がその部分のセルを文字列に設定すると、その日付はmarch1にはならずわけの分からない数値に替わってしまう。

ずっとXLMだけでデータを受け渡してるならこんなことにはならないのだけど、
多くの人とデータを共有しようとするとこんなことになるんだよ。


103: 2020/08/08(土) 15:40:25.23

年賀状を作るとき
日本郵便の「はがきデザインキット」で
csvで住所データをエクスポートして

さてexcelで編集しようとしたら・・・


104: 2020/08/08(土) 15:40:27.73

書式設定で文字列を選べばいいというが、
何度説明しても設定できない人もいるとか
設定するとキモい緑三角マークで挑発してくるとかあるのだよ
あと、ぱっと見で設定が判らない

「'」を入れるは次善策ではあるが、そもそも情報が変化してる
例えば =IF(A1="SEPT1",... というのを
すべて=IF(A1="'SEPT1",... と書き換えなければならない

あと個人的に困るのは大文字小文字が勝手に変わること
といいながら「iPS」と入れたらそのままでちょっと見直した直後、
「CMa」(おおぐま座)と入れたらCmaと変換されて草


106: 2020/08/08(土) 16:08:15.68

そんなことよりもOfficeの「置換」コマンドのショートカットを「Ctrl+R」にする決断をしてほしい


110: 2020/08/08(土) 16:49:33.62

excelに限らず自動なんちゃら機能はだいたいクソ


114: 2020/08/08(土) 17:17:12.27

ホントに研究者なのか?
エプロンしてんじゃねぇのか?


116: 2020/08/08(土) 17:27:48.44

だいたい、データがexcelだけで完結する訳ないのよね
作ったデータも元はexcelじゃないし、データを使いたい時はexcelからcsvで出力して別のプログラムに食わせるんだから
excelだけで完結するものと思ってるからセルの書式設定とかの発想が出てくる


119: 2020/08/08(土) 18:19:15.29

コンピュータの文字列表記って理系の文字表記に関して未だに
物凄く使い勝手が悪いからなあ

Σも∫も上下に添え字を付けられない
化学式も数列もテンソルも添え字を自由に変えられない
Wordでやろうとしたら出来るけど1文字入力に10秒かかる始末

その辺綺麗に書きたかったらLaTeXでも使ってろ!と言われそうだが

まあこれがあるから理系の授業は未だに紙のノートに書くしか無いんだよなあ
タブレット上で手書きで書ければいいけど
(直接サーバーからデータを貰ってこられればそりゃ確かに楽だがw)

コンピュータによるメモは図でも未だに要領が悪い
最終的な仕上がりはグラフィックアプリの方が美しいが
きったなくても良いから本人が分かればいい!というスケッチを
ガガガガッ!と書くならやっぱりまだ手書きが早い


132: 2020/08/08(土) 21:04:26.83

マイクロソフトのツールは

痒いところを余計に痒くしてくる
気が利かないツールばかりだ


142: 2020/08/08(土) 22:23:43.82

実際この自動変換機能ものすごい邪魔だよな。役に立つこともないし。
なぜデフォルトがオフじゃないんだ


143: 2020/08/08(土) 22:28:53.90

毎度文字列設定にすればいいんだけど
それはそれでウザいんだよね…
デフォルトでは勝手な変換切ってくれれば良いのに


146: 2020/08/08(土) 22:34:46.32

俺は素人だが表計算ソフトで数値以外を扱うのは限界なんだろう
プログラミング言語だと変数とかを使うときに
明確にどういう変数か宣言?させるのもあるんだっけ?

だから、数値以外のデータを扱う場合は、そういうソフトや
フォーマット等の、それなりの仕組みが必要であって
Excelにそのまま全部押し付けるのは無理があると思う


引用元 : 【話題】「Excelが日付に変換してしまうから」一部遺伝子の名称を変更。ヒトゲノム解析の科学者ら [しじみ★]