<div dir="ltr"><div>Hello,</div><div><br></div><div>This issue <a href="https://github.com/datactive/bigbang/issues/509">#509</a> was perhaps misclassified as a later milestone and so hasn't come up in our recent meetings.</div><div><br></div><div>It is essentially a proposal that we use submodules to make curated datasets available via bigbang. Example documentation for data that links email domains to a category is here:</div><div><a href="https://bigbang-py.readthedocs.io/en/latest/datasets.html#">https://bigbang-py.readthedocs.io/en/latest/datasets.html#</a></div><div><br></div><div>My understanding is that the richest dataset in the BigBang repository is the organizations data, which is currently in examples/organizations:</div><div><br></div><div><a href="https://github.com/datactive/bigbang/blob/main/examples/organizations/organization_categories.csv">https://github.com/datactive/bigbang/blob/main/examples/organizations/organization_categories.csv</a></div><div><br></div><div>How would you feel about a PR that moved this, and its .md metadata document, to bigbang.datasets.organizations ?</div><div><br></div><div>I would quite like to include this dataset as part of the tutorial at CLBE, so I would try to have this in by the end of the week for inclusion in the 0.4 release.</div><div><br></div><div>Cheers,</div><div>Seb<br></div><div><br></div></div>