<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">Also, it looks like their follow-on paper specifically considers the problem of identifying individuals who use different email addresses, what we've been working on and calling "entity resolution":<div class=""><a href="https://link.springer.com/chapter/10.1007/978-3-319-70284-1_23" class="">https://link.springer.com/chapter/10.1007/978-3-319-70284-1_23</a></div><div class=""><br class=""></div><div class="">And following citations from these papers, I see that there's an ongoing project at the Syracuse I School about studying open source software development communities, called FLOSSmole. That includes trying to gather common datasets to share for analysis, and one of the people involved has written about common infrastructure for studying mailing list archives.</div><div class=""><div class=""><a href="http://ieeexplore.ieee.org/abstract/document/6664730/?anchor=references" class="">http://ieeexplore.ieee.org/abstract/document/6664730/?anchor=references</a></div></div><div class=""><br class=""></div><div class="">Note, some of these websites are kinda broken because their certificates are messed up, but if you're willing to risk adding an exception, I think the static content is still fine:</div><div class=""><a href="https://flossmole.org/" class="">https://flossmole.org/</a></div><div class=""><a href="https://floss.syr.edu/" class="">https://floss.syr.edu/</a></div><div class=""><br class=""></div><div class="">I'm not sure how I missed all this before, but I think there is existing work / people to collaborate with.</div><div class=""><br class=""></div><div class="">—Nick</div><div class=""><div><br class=""><blockquote type="cite" class=""><div class="">On Mar 26, 2018, at 4:37 PM, Nick Doty <<a href="mailto:npdoty@ischool.berkeley.edu" class="">npdoty@ischool.berkeley.edu</a>> wrote:</div><br class="Apple-interchange-newline"><div class=""><meta http-equiv="Content-Type" content="text/html; charset=us-ascii" class=""><div style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">Has anyone seen this paper or spoken with the authors?<div class=""><br class=""></div><div class=""><div tabindex="0" class="gs_citr">Niedermayer, Heiko, et al. "An analysis of IETF activities using mailing lists and social media." <i class="">International Conference on Internet Science</i>. Springer, Cham, 2016.</div></div><div tabindex="0" class="gs_citr"><br class=""></div><div tabindex="0" class="gs_citr"><a href="https://www.net.in.tum.de/fileadmin/bibtex/publications/papers/INSCI_2016.pdf" class="">https://www.net.in.tum.de/fileadmin/bibtex/publications/papers/INSCI_2016.pdf</a></div><div tabindex="0" class="gs_citr"><br class=""></div><div tabindex="0" class="gs_citr">Authors are at the Technical University of Munich.</div><div tabindex="0" class="gs_citr"><br class=""></div><div tabindex="0" class="gs_citr">It's remarkably similar / related to our current working on analysis of IETF activity using mailing lists, and even includes some similar graphs to ones I've shown on perpass / other list activity post-Snowden. They also looked at Twitter references to RFCs, although they appear to conclude that there isn't as much going on there. They could also be potential collaborators; I'm not sure if there's a whole lot else they've done here but I think there's at least one follow-on paper from last year.</div><div tabindex="0" class="gs_citr"><br class=""></div><div tabindex="0" class="gs_citr">Cheers,</div><div tabindex="0" class="gs_citr">Nick</div></div></div></blockquote></div><br class=""></div></body></html>