パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

人気オープンソースプロジェクトは何人欠員が出たら破綻するのか」記事へのコメント

  • by Anonymous Coward

    調査レポート(?)にも、"Degree of Authorship" を使ったとしか書いていないけど、それで計算方法が思い浮かぶくらい業界ではメジャーな方法なの?一つのソフトウエアを維持していくのに、誰がどのくらい貢献しているかって計算するのは簡単ではないと思うんだけど。

    • by Anonymous Coward on 2015年07月15日 20時57分 (#2848073)

      タレコミのリンク先にあるようにDOAはこのプロシーディングで定義されてます。
      このプロシーティングは今の時点で引用57(google scholar)なので、この分野の専門家にはまずまず注目されていると言えると思います。ただ、大学の外で通用する方法かというと疑問です。

      まず目標としては、あるコード片の事を良く知ってるのは誰かを自動的に判定したいというのが有って、それは多分authorshipを持ってる人が良く知ってるだろうという直観がある。で、authorshipを数値的にモデル化するのがDOA。

      DOAは3つの実数値FA(First Authorship)、DL(DeLiveries)、AC(Acceptances)からなる多重線形モデルで、ある開発者はある要素(クラスとかメソッドとか)のどのくらい重要なauthorなのかを説明するモデルです。
      FA、DL、ACはあるプロジェクトのソースの履歴から明確に定義かのうな量で次の様な定義です。

      FAは、ある開発者が、ある要素を最初に作った回数(論文にはちゃんと書いてないけど、多分0か1、sub-elementみたいなのを認めると2以上になるかも)。
      DLは、ある開発者が、ある要素を最初に作った後(FA>=1)、何回更新したか。
      ACは、ある開発者が最初に作った要素を、他の開発者によって何回更新されたか。
      直観的には、FA、DLが高いと、あ、こいつはauthorっぽいなってなって、ACが高いと、他の人にauthorshipを奪われてるように見える。

      モデルの係数の決め方は、あらかじめ開発者達に、この開発者はこの要素のどんくらい知ってるかを1-5で答えてもらって、その結果を再現できるように線形回帰分析する。

      ちなみに、論文によるとDOAだけだとどうも上手くいかなくて、開発者がどんくらいある要素に興味を持ってるかを指標に加えると上手くいくらしい。
      つまり、最初に作った奴が良く知ってるとは限らない(あるいは、良く知ってると周りから思われていない)。
      興味を持ってる度合いをモデル化するのがDOI(Degree Of Interest)で、何回ファイルを開いたかと、編集中のキーストロークの数で説明される線形モデル。

      DOAとDOIを合わせてDOK(Degree Of Knowledge)としてやると、さっきのアンケートを大体再現できて、あるコードベースを基に作ったモデルが他のコードベースでも大体上手くいくらしい。

      後、タレコミの件をDOAでやったのかDOKでやったのかは分かりません。一応DOAでやったとは書いてあるけど、論文の主旨(DOAでは上手くいかない)に反する。

      親コメント
      • Re:計算方法は? (スコア:4, 参考になる)

        by tamanegi (38323) on 2015年07月15日 22時02分 (#2848103) 日記

        そこまで読むならリンク先の下の方、More Infoのところの奴、
        https://dx.doi.org/10.7287/peerj.preprints.1233v1 [doi.org]
        も読んで欲しい。それをチラ見した限り、確実にDOA(定義も書いてある)で
        やってて、DOKは一切出てこない。

        自分はそのDOAとかいうのを定義している方の論文は中を見れないんだけど、
        今回のネタ元のを読む限り(前段落のリンク)、DOAのモデルは7人のプロっぽい
        Java開発者への調査から決めてるけど、他の言語のプロジェクトについても
        適用できるくらいにロバストだと示されている、って書いてある。

        なんか #2848073 のコメと今回のネタ元で、citeしてる同一の論文の解釈が
        すんごい矛盾してるように感じる。どういうことだよ…

        親コメント
        • by Anonymous Coward

          あ、ほんとだ。
          こっちだとDOAだけでやっているとはっきり分かりますね。

          すんごい矛盾してるように感じる。どういうことだよ…

          あぁ、これは多分「DOAだけだとどうも上手くいかなくて・・・」という#2848073の表現のせいだと思います。実際には、DOI入れるとモデルの精度が上がるという事です。後は、モデルと実測値の乖離をどこまで許容できるかと、モデルの簡便さのトレードオフで、このタレコミ元の人達にとってはDOAの精度で十分だったという事だと思います。

          誤った印象を与えてしまってすいません。
          #2848073のは下げといてください。

      • by Anonymous Coward

        Linusはコードを書くことよりディレクターとしての役割の方が重要になっているのではと思うんだけど、LinuxのAuthorshipはどの程度なんだろう?

海軍に入るくらいなら海賊になった方がいい -- Steven Paul Jobs

処理中...