<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:DengXian;
        panose-1:2 1 6 0 3 1 1 1 1 1;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:"\@DengXian";
        panose-1:2 1 6 0 3 1 1 1 1 1;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
span.EmailStyle18
        {mso-style-type:personal-reply;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style>
</head>
<body lang="EN-GB" link="blue" vlink="purple" style="word-wrap:break-word">
<div class="WordSection1">
<p class="MsoNormal">Hi all,<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I was on holiday in China till today. I just saw there are interesting comments and insights for the NLP side of work.<o:p></o:p></p>
<p class="MsoNormal">I would be happy to join the meetings forward and discuss more about the details
<span style="font-family:"Apple Color Emoji"">😊</span> .<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Best,<o:p></o:p></p>
<p class="MsoNormal">Effy<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0cm 0cm 0cm">
<p class="MsoNormal" style="margin-bottom:12.0pt"><b><span style="font-size:12.0pt;color:black">From:
</span></b><span style="font-size:12.0pt;color:black">Bigbang-dev <bigbang-dev-bounces@data-activism.net> on behalf of Priyanka Sinha <priyanka.sinha.iitg@gmail.com><br>
<b>Date: </b>Monday, 30 January 2023 at 07:03<br>
<b>To: </b>Sebastian Benthall <sbenthall@gmail.com><br>
<b>Cc: </b>bigbang-dev@data-activism.net <bigbang-dev@data-activism.net><br>
<b>Subject: </b>Re: [Bigbang-dev] Clarifying theoretical commitments going into IETF 116<o:p></o:p></span></p>
</div>
<div>
<div>
<p class="MsoNormal">I agree with you .. please find my comments inline<o:p></o:p></p>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<div>
<p class="MsoNormal">On Wed, 25 Jan 2023 at 18:18, Sebastian Benthall <<a href="mailto:sbenthall@gmail.com">sbenthall@gmail.com</a>> wrote:<o:p></o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div>
<div>
<p class="MsoNormal">From a computational perspective, in my opinion from what you are saying, doing CI would mean I just look at the flow of dialogues, i.e., turn by turn or order of the messages (posts and comments) that one and others have posted, but in
 a graph theory sense, I can ignore the temporal aspect and treat all the conversation together. Technically, this may avoid getting into issues of short text, noisy text that some statistical NLP methods become difficult due to short context. This may also
 be less complex computationally. <o:p></o:p></p>
</div>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Aha. I see what you mean. This does seem computationally tractable.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">It reminds me of some of the earliest work I did with BigBang.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">What comes to mind is that different working groups might be different 'contexts' and so have different patterns to how the discourse unfolds.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">To be honest, this is a bit of a stretch for CI as envisioned by Helen Nissenbaum. But when I originally approached Helen after working on BigBang, I also was thinking about mailings lists as contexts and messages sent as information flows.
 I suppose making this connection in a publication would be worthwhile :)<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">To really make it work with CI, we would need to also track personal identifiers within email bodies. I.e not only replies to people, but also references to people. (Maybe this would potentially include legal persons, such as company names.)
 So entity recognition would be great for this, if it was working.<o:p></o:p></p>
</div>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">So, identifying whether the email address used even when slightly different refers to the exact same person, is something my algorithm can do which I have presented at the AID workshop. <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Within the email body, doing the entity recognition as well as perhaps coreference resolution (i.e., the name of the person or company is not present but is referred to with pronouns such as he/she/they) has varying accuracy. I was happy
 to know of Effy's work in this direction. Myself, I would try to use Effy's published work as well as try Lauren Berk's (now Lauren Wheelock) work <a href="https://eur04.safelinks.protection.outlook.com/?url=https%3A%2F%2Fgithub.com%2Flauren897&data=05%7C01%7Cx.li3%40uva.nl%7Cb02ed17db40a47e017dd08db0287b14d%7Ca0f1cacd618c4403b94576fb3d6874e5%7C0%7C0%7C638106554046165793%7CUnknown%7CTWFpbGZsb3d8eyJWIjoiMC4wLjAwMDAiLCJQIjoiV2luMzIiLCJBTiI6Ik1haWwiLCJXVCI6Mn0%3D%7C3000%7C%7C%7C&sdata=PmV9RNj%2BLeBD1qRNSEL967AvU8JJ8bcmBLPKwr2Wljo%3D&reserved=0">https://github.com/lauren897</a> <a href="https://eur04.safelinks.protection.outlook.com/?url=https%3A%2F%2Fdspace.mit.edu%2Fhandle%2F1721.1%2F127291%3Fshow%3Dfull&data=05%7C01%7Cx.li3%40uva.nl%7Cb02ed17db40a47e017dd08db0287b14d%7Ca0f1cacd618c4403b94576fb3d6874e5%7C0%7C0%7C638106554046165793%7CUnknown%7CTWFpbGZsb3d8eyJWIjoiMC4wLjAwMDAiLCJQIjoiV2luMzIiLCJBTiI6Ik1haWwiLCJXVCI6Mn0%3D%7C3000%7C%7C%7C&sdata=dAJjPOkwLux0zkO0NJhtP9rL6UIKEwU6bbd2NBPMtvg%3D&reserved=0">https://dspace.mit.edu/handle/1721.1/127291?show=full</a>
 which when I had attended worked well for cases with short context.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">What kind of graph metrics would you find worth tracking?<o:p></o:p></p>
</div>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">This is an interesting question for me, since I haven't thought of the graph from the perspective of say measures like betweenness centrality, etc. I thought of it as a representation based on which we mine for insights, using new graph
 neural network algorithms.  For example, if we represent the discourses as a multi edged temporal graph, where the different types of edges represent different aspects of the communication that we take into account, then if we work on extracting say graphlets
 (which in my mind are homeomorphic subgraph patterns (say could have maybe 15 nodes which could be one set of folks that hold a particular view). Then these graphlets we could label as different viewpoints in how they view privacy?? I apologize if it doesn't
 make sense, I haven't yet figured this out . I mean we could take the direction where we are not doing this .. and we model the problem as a agent simulation where the goals are related to the CI .. and inside we represent the agents and their interaction
 in the graph structure and we create a learning model whose weights we are trying to learn by trying to reach the goals based on the existing dialogue traces (aka mailing list conversations) we have.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div>
<div>
<p class="MsoNormal">If the WN world view is so fine-grained that we need to look at timestamps and model in continuous time domain, then for me I think that is too challenging, albeit interesting. If WN is just major events and thus we can split our data into
 windows or chunks manually, then we avoid the problem. <o:p></o:p></p>
</div>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">I need to dig deeper to recall exactly how the computational sociology components of WN work.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">But my sense is that the qualitative theory in WN is much richer than its technical operationalization.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">That leaves a big gap that we can start trying to fill.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">I don't think continuous time analysis will be necessary; windows or chunks should be fine.<o:p></o:p></p>
</div>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">AWesome !!!! <o:p></o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">- S<o:p></o:p></p>
</div>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">-priyanka <o:p></o:p></p>
</div>
</div>
</div>
</div>
</body>
</html>