Excelの自動書式により、遺伝子のリストを使用する論文の約20%に誤った遺伝子シンボルが掲載されているとの調査結果 97
確認 部門より
たとえば「Septin 2」の遺伝子シンボルは「SEPT2」だが、デフォルトの状態でExcelに入力すると「2-Sep」に変換される。また、「Membrane-Associated Ring Finger (C3HC4) 1, E3 Ubiquitin Protein Ligase」の遺伝子シンボル「MARCH1」は「1-Mar」に変換されるほか、理研の「2310009E13」のようなクローンIDは「2.31E+19」に変換されてしまう。保持されるデータ自体が変換されてしまうため、後で書式を変更しても復元することはできない。
同様の変換はExcelだけでなく、LibreOffice CalcやApache OpenOffice Calcでも発生する。Googleスプレッドシートでは発生しないとのことだが、試してみたところクローンIDは変換されてしまった。
こういった問題と回避方法は10年以上前から注目されている。しかし、事前にセルの書式設定で「文字列」を選ぶか、先頭に「'」を付加して文字列として 入力する方法ぐらいで、完全に無効化する方法はないこともあり、簡単にはなくならないようだ。