Group cedar
cedar
LIX, Ecole Polytechnique
Themes: data science and artifical intelligence
Our research is organized along two main themes:
- We seek to exploit parallel data processing infrastructures for highly scalable, parallel Big Data storage and processing tools.Topic we study in this area include: highly efficient query processing in polystores, efficient query answering in the presence of ontologies, and algorithms for scalable, fast data analytics.
- To enhance the usefulness of Big Data, we study new paradigms of user interaction with Big Data, based on exploratory querying, analytics for semantic graphs, and intuitive query tools over highly heterogeneous data.
Contact person: Ioana Manolescu, http://www-rocq.inria.fr/~manolesc
Web site: https://team.inria.fr/cedar/
Journal articles
2022
- ref_biblio
- Angelos Christos Anadiotis, Oana Balalau, Catarina Conceicao, Helena Galhardas, Mhd Yamen Haddad, et al.. Graph integration of structured, semistructured and unstructured data for data journalism. Information Systems, 2022, 104, pp.101846. ⟨10.1016/j.is.2021.101846⟩. ⟨hal-03150441v2⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Sein Minn. AI-assisted knowledge assessment techniques for adaptive learning environments. Computers and Education: Artificial Intelligence, 2022, 3, ⟨10.1016/j.caeai.2022.100050⟩. ⟨hal-03897560⟩
- Accès au texte intégral et bibtex
-
2021
- ref_biblio
- Angelos-Christos Anadiotis, Oana Balalau, Théo Bouganim, Francesco Chimienti, Helena Galhardas, et al.. Empowering Investigative Journalism with Graph-based Heterogeneous Data Management. Bulletin of the Technical Committee on Data Engineering, In press. ⟨hal-03337650⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Vincent Jacob, Fei Song, Arnaud Stiegler, Bijan Rad, Yanlei Diao, et al.. Exathlon: A Benchmark for Explainable Anomaly Detection over Time Series. Proceedings of the VLDB Endowment (PVLDB), 2021. ⟨hal-03381732⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Vincent Jacob, Fei Song, Arnaud Stiegler, Bijan Rad, Yanlei Diao, et al.. A Demonstration of the Exathlon Benchmarking Platform for Explainable Anomaly Detection. Proceedings of the VLDB Endowment (PVLDB), 2021. ⟨hal-03383535⟩
- Accès au texte intégral et bibtex
-
2020
- ref_biblio
- Rana Alotaibi, Bogdan Cautis, A. Deutsch, Moustafa Latrache, Ioana Manolescu, et al.. ESTOCADA: Towards Scalable Polystore Systems. Proceedings of the VLDB Endowment (PVLDB), 2020, 13 (12), pp.2949-2952. ⟨10.14778/3415478.3415516⟩. ⟨hal-03150404⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Angelos-Christos Anadiotis, Raja Appuswamy, Anastasia Ailamaki, Ilan Bronshtein, Hillel Avni, et al.. A system design for elastically scaling transaction processing engines in virtualized servers. Proceedings of the VLDB Endowment (PVLDB), 2020, 13 (12), pp.3085-3098. ⟨10.14778/3415478.3415536⟩. ⟨hal-03104618⟩
- Accès au bibtex
-
- ref_biblio
- François Goasdoué, Pawel Guzewicz, Ioana Manolescu. RDF graph summarization for first-sight structure discovery. The VLDB Journal, 2020, 29 (5), pp.1191-1218. ⟨10.1007/s00778-020-00611-y⟩. ⟨hal-02530206v2⟩
- Accès au texte intégral et bibtex
-
2019
- ref_biblio
- Sejla Cebiric, François Goasdoué, Haridimos Kondylakis, Dimitris Kotzinos, Ioana Manolescu, et al.. Summarizing Semantic Graphs: A Survey. The VLDB Journal, 2019, 28 (3). ⟨hal-01925496⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Yanlei Diao, Pawel Guzewicz, Ioana Manolescu, Mirjana Mazuran. Spade: A Modular Framework for Analytical Exploration of RDF Graphs. Proceedings of the VLDB Endowment (PVLDB), 2019, Proceedings of the VLDB Endowment, Vol. 12, No. 12, 12 (12), pp.1926-1929. ⟨10.14778/3352063.3352101⟩. ⟨hal-02152844v2⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Khaled Zaouk, Fei Song, Chenghao Lyu, Arnab Sinha, Yanlei Diao, et al.. UDAO: A Next-Generation Unified Data Analytics Optimizer. Proceedings of the VLDB Endowment (PVLDB), 2019, 12 (12), ⟨10.14778/3352063.3352103⟩. ⟨hal-02267180⟩
- Accès au texte intégral et bibtex
-
2018
- ref_biblio
- Sylvie Cazalens, Julien Leblay, Philippe Lamarre, Ioana Manolescu, Xavier Tannier. Computational Fact Checking: A Content Management Perspective. Proceedings of the VLDB Endowment (PVLDB), 2018, 11 (12), pp.2110-2113. ⟨10.14778/3229863.3229880⟩. ⟨hal-01853067⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Camille Chanial, Rédouane Dziri, Helena Galhardas, Julien Leblay, Minh-Huong Le Nguyen, et al.. ConnectionLens: Finding Connections Across Heterogeneous Data Sources. Proceedings of the VLDB Endowment (PVLDB), 2018, 11, pp.4. ⟨10.14778/3229863.3236252⟩. ⟨hal-01841009⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Enhui Huang, Liping Peng, Luciano Di Palma, Ahmed Abdelkafi, Anna Liu, et al.. Optimization for active learning-based interactive database exploration. Proceedings of the VLDB Endowment (PVLDB), 2018, 12 (1), pp.71-84. ⟨10.14778/3275536.3275542⟩. ⟨hal-01969886⟩
- Accès au texte intégral et bibtex
-
2017
- ref_biblio
- Markus Krötzsch, Tomáš Masopust, Michaël Thomazo. Complexity of universality and related problems for partially ordered NFAs. Information and Computation, 2017, 255, pp.177 - 192. ⟨10.1016/j.ic.2017.06.004⟩. ⟨hal-01571398⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Ioana Manolescu. ContentCheck: Content Management Techniques and Tools for Fact-checking. ERCIM News, 2017. ⟨hal-01596563⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Tomáš Masopust, Michaël Thomazo. On Boolean Combinations forming Piecewise Testable Languages. Theoretical Computer Science, 2017, 682. ⟨hal-01637057⟩
- Accès au texte intégral et bibtex
-
Conference papers
2023
- ref_biblio
- Angelos Christos Anadiotis, Ioana Manolescu, Madhulika Mohanty. Integrating Connection Search in Graph Queries. ICDE 2023 - 39th IEEE International Conference on Data Engineering, Apr 2023, Anaheim (CA), United States. ⟨hal-04110779⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Angelos Christos Anadiotis, Ioana Manolescu, Madhulika Mohanty. More power to SPARQL: From paths to trees. ESWC 2023 - Extended Semantic Web Conference, May 2023, Hersonissou, Crete, Greece. ⟨hal-04102807⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Nelly Barret, Antoine Gauquier, Jia-Jean Law, Ioana Manolescu. PathWays: entity-focused exploration of heterogeneous data graphs. ESWC 2023 - 20th European Semantic Web Conference, May 2023, Hersonissos (Crete), Greece. ⟨hal-04103293⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Eleni Gkiouzepi, Athanasios Andreou, Oana Goga, Patrick Loiseau. Collaborative Ad Transparency: Promises and Limitations. SP 2023 - 44th IEEE Symposium on Security and Privacy, May 2023, San Francisco, United States. ⟨hal-03916393⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Prajna Upadhyay, Oana Balalau, Ioana Manolescu. Open Information Extraction with Entity Focused Constraints. EACL 2023 - 17th Conference of the European Chapter of the Association for Computational Linguistics, May 2023, Dubrovnik, Croatia. ⟨hal-03980046⟩
- Accès au texte intégral et bibtex
-
2022
- ref_biblio
- Angelos Christos Anadiotis, Ioana Manolescu, Madhulika Mohanty. Integrating Connection Search in Graph Queries. BDA 2022 - 38ème Conférence sur la Gestion de Données - Principes, Technologies et Applications, Oct 2022, Clermont-Ferrand, France. ⟨hal-03886320⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Angelos Christos Anadiotis, François Goasdoué, Mhd Yamen Haddad, Ioana Manolescu. Towards Speeding Up Graph-Relational Queries in RDBMSs. BDA 2022 - 38èmes journées de la conférence BDA « Gestion de Données – Principes, Technologies et Applications, Oct 2022, Clermont-Ferrand, France. ⟨hal-03791272⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Oana Balalau, Simon Ebel, Théo Galizzi, Ioana Manolescu, Quentin Massonnat, et al.. Fact-checking Multidimensional Statistic Claims in French. TTO 2022 - Truth and Trust Online, Oct 2022, Boston [Hybrid Event], United States. ⟨hal-03791175⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Oana Balalau, Simon Ebel, Théo Galizzi, Ioana Manolescu, Quentin Massonnat, et al.. Statistical Claim Checking: StatCheck in Action (demonstration). CIKM 2022 - 31st ACM International Conference on Information and Knowledge Management, Oct 2022, Atlanta / Hybrid, United States. ⟨hal-03767992⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Oana Balalau, Simon Ebel, Théo Galizzi, Ioana Manolescu, Quentin Massonnat. Statistical Claim Checking: StatCheck in Action. BDA 2022 - 38ème Conférence sur la Gestion de Données – Principes, Technologies et Applications (BDA 2022), Oct 2022, Clermont - Ferrand, France. ⟨hal-03932371⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Nelly Barret, Ioana Manolescu, Prajna Upadhyay. Abstra: Toward Generic Abstractions for Data of Any Model. BDA 2022 - informal publication only, Oct 2022, Clermont-Ferrand, France. ⟨hal-03774599⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Nelly Barret, Ioana Manolescu, Prajna Upadhyay. Abstra: Toward Generic Abstractions for Data of Any Model. CIKM 2022 - 31st ACM International Conference on Information and Knowledge Management, Oct 2022, Atlanta, Georgia / Hybrid, United States. ⟨hal-03767967⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Dan Berrebbi, Nicolas Huynh, Oana Balalau. GraphCite: Citation Intent Classification in Scientific Publications via Graph Embeddings. 2nd International Workshop on Scientific Knowledge: Representation, Discovery, and Assessment, Apr 2022, Lyon / Virtual, France. ⟨hal-03648498⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Muhammad Ghufran Khan. Scalable Analytics on Multi-Streams Dynamic Graphs. BDA 2022 - 38ème Conférence sur la Gestion de Données – Principes, Technologies et Applications, Oct 2022, Clermont-Ferrand, France. ⟨hal-03903287⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Chenghao Lyu, Qi Fan, Fei Song, Arnab Sinha, Yanlei Diao, et al.. Fine-Grained Modeling and Optimization for Intelligent Resource Management in Big Data Processing. VLDB 2022 - 48th International Conference on Very Large Databases, Sep 2022, Sydney, Australia. ⟨hal-03897397⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Ioana Manolescu. Teasing journalistic findings out of heterogeneous sources: a data/AI journey: (invited keynote). DEBS 2022 : The 16th ACM International Conference on Distributed and Event-based Systems, Jun 2022, Copenhagen, Denmark. pp.1-1, ⟨10.1145/3524860.3544406⟩. ⟨hal-03945733⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Jill-Jênn Vie, Tomas Rigaux, Sein Minn. Privacy-Preserving Synthetic Educational Data Generation. EC-TEL 2022 - 17th European Conference on Technology Enhanced Learning, Sep 2022, Toulouse, France. ⟨hal-03715416⟩
- Accès au texte intégral et bibtex
-
2021
- ref_biblio
- Rana Alotaibi, Bogdan Cautis, Alin Deutsch, Ioana Manolescu. HADAD: A Lightweight Approach for Optimizing Hybrid Complex Analytics Queries. ACM SIGMOD 2021 - International Conference on Management of Data, Jun 2021, Xi'an / Online, China. ⟨hal-03347677⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Angelos Christos Anadiotis, Oana Balalau, Théo Bouganim, Francesco Chimienti, Helena Galhardas, et al.. Discovering Conflicts of Interest across Heterogeneous Data Sources with ConnectionLens. ACM International Conference on Information and Knowledge Management (CIKM 2021), Nov 2021, Online, Australia. ⟨10.1145/3459637.3481982⟩. ⟨hal-03337765⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Oana Balalau, Roxana Horincar. From the Stage to the Audience: Propaganda on Reddit. EACL 2021 - 16th Conference of the European Chapter of the Association for Computational Linguistics, Apr 2021, Online, France. ⟨hal-03351621⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Nelly Barret, Ioana Manolescu, Prajna Upadhyay. Toward Generic Abstractions for Data of Any Model. BDA 2021 - Informal publication only, Oct 2021, Paris, France. ⟨hal-03344041v2⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Nelly Barret. Facilitating Heterogeneous Dataset Understanding. BDA 2021 - informal publication only, Oct 2021, Paris, France. ⟨hal-03344102⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Théo Bouganim, Helena Galhardas, Ioana Manolescu. Efficiently identifying disguised nulls in heterogeneous text data. BDA (Conférence sur la Gestion de Données – Principles, Technologies et Applications), Oct 2021, Paris, France. ⟨hal-03347947⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Maxime Buron, Marie-Laure Mugnier, Michaël Thomazo. Parallelisable Existential Rules: a Story of Pieces. KR 2021 - 18th International Conference on Principles of Knowledge Representation and Reasoning, Nov 2021, Virtual, Vietnam. pp.163-173, ⟨10.24963/kr.2021/16⟩. ⟨hal-03405745⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Yanlei Diao, Pawel Guzewicz, Ioana Manolescu, Mirjana Mazuran. Efficient Exploration of Interesting Aggregates in RDF Graphs. SIGMOD/PODS '21 - International Conference on Management of Data, Jun 2021, Virtual Event China, China. pp.392-404, ⟨10.1145/3448016.3457307⟩. ⟨hal-03320929⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Bijan Rad, Fei Song, Vincent Jacob, Yanlei Diao. Explainable Anomaly Detection on High-Dimensional Time Series Data. The 15th ACM International Conference on Distributed and Event-based Systems (DEBS ’21), Jun 2021, virtual event, Italy. ⟨10.1145/3465480.3468292⟩. ⟨hal-03522878⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Saumya Yashmohini Sahai, Oana Balalau, Roxana Horincar. Breaking Down the Invisible Wall of Informal Fallacies in Online Discussions. ACL-IJCNLP 2021 - Joint Conference of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing, Aug 2021, Online, France. ⟨hal-03351649⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Fei Song, Khaled Zaouk, Chenghao Lyu, Arnab Sinha, Qi Fan, et al.. Spark-based Cloud Data Analytics using Multi-Objective Optimization. ICDE - 37th IEEE International Conference on Data Engineering, Apr 2021, Chania, Greece. ⟨hal-02549758⟩
- Accès au texte intégral et bibtex
-
2020
- ref_biblio
- Angelos Christos Anadiotis, Mhd Yamen Haddad, Ioana Manolescu. Graph-based keyword search in heterogeneous data sources. BDA 2020 - 36ème Conférence sur la Gestion de Données – Principes, Technologies et Applications, Oct 2020, Online, France. ⟨hal-02934277⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Oana Balalau, Sagar Goyal. SubRank: Subgraph Embeddings via a Subgraph Proximity Measure. PAKDD 2020 - Pacific-Asia Conference on Knowledge Discovery and Data Mining, May 2020, Singapore, Singapore. pp.487-498, ⟨10.1007/978-3-030-47426-3_38⟩. ⟨hal-03134181⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Irène Burger, Ioana Manolescu, Emmanuel Pietriga, Fabian M Suchanek. Toward Visual Interactive Exploration of Heterogeneous Graphs. SEAdata 2020 - Workshop on Searching, Exploring and Analyzing Heterogeneous Data in conjunction with EDBT/ICDT, Mar 2020, Copenhagen, Denmark. ⟨hal-02468778⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Maxime Buron, François Goasdoué, Ioana Manolescu, Tayeb Merabti, Marie-Laure Mugnier. Revisiting RDF storage layouts for efficient query answering. SSWS 2020 - 13th International Workshop on Scalable Semantic Web Knowledge Base Systems, Nov 2020, Athène, Greece. ⟨hal-02921457⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Maxime Buron, François Goasdoué, Ioana Manolescu, Marie-Laure Mugnier. Obi-Wan: Ontology-Based RDF Integration of Heterogeneous Data. VLDB 2020 - 46th International Conference on Very Large Data Bases, Aug 2020, Tokyo, Japan. ⟨hal-02921434⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Maxime Buron, François Goasdoué, Ioana Manolescu, Marie-Laure Mugnier. Ontology-Based RDF Integration of Heterogeneous Data. EDBT 2020 - 23rd International Conference on Extending Database Technology, Mar 2020, Copenhagen, Denmark. pp.299-310, ⟨10.5441/002/edbt.2020.27⟩. ⟨hal-02446427⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Azin Ghazimatin, Oana Balalau, Rishiraj Saha, Gerhard Weikum. PRINCE: Provider-side Interpretability with Counterfactual Explanations in Recommender Systems. WSDM 2020 - 13th ACM International Conference on Web Search and Data Mining, Feb 2020, Houston, Texas, United States. ⟨hal-02433443⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Ioana Manolescu. Exploring RDF Graphs through Summarization and Analytic Query Discovery. DOLAP 2020 - 22nd International Workshop On Design, Optimization, Languages and Analytical Processing of Big Data, Mar 2020, Copenhagen, Denmark. ⟨hal-02935956⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Ioana Manolescu. From Data to the Press: Data Management for Journalism and Fact-Checking. DATA 2020 - 9th International Conference on Data Science, Technology and Applications, Jul 2020, Paris / Virtuel, France. ⟨hal-02895316⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Ioana Manolescu. Integrating (Very) Heterogeneous Data Sources: A Structured and an Unstructured Perspective. ADBIS 2020 - 24th European Conference on Advances in Databases and Information Systems, Aug 2020, Lyon, France. pp.15-20, ⟨10.1007/978-3-030-54832-2_3⟩. ⟨hal-02930728⟩
- Accès au bibtex
-
- ref_biblio
- Aunn Raza, Periklis Chrysogelos, Angelos Christos Anadiotis, Anastasia Ailamaki. Adaptive HTAP through Elastic Resource Scheduling. SIGMOD/PODS '20 - International Conference on Management of Data, Jun 2020, Portland OR USA, United States. pp.2043-2054, ⟨10.1145/3318464.3389783⟩. ⟨hal-03104617⟩
- Accès au bibtex
-
- ref_biblio
- Guillaume Thiry, Ioana Manolescu, Leo Liberti. A Question Answering System For Interacting with SDMX Databases. NLIWOD 2020 - 6th Natural Language Interfaces for the Web of Data / Workshop (in conjunction with ISWC), Nov 2020, Heraklion, Greece. ⟨hal-03021075⟩
- Accès au texte intégral et bibtex
-
2019
- ref_biblio
- Rana Alotaibi, Damian Bursztyn, Alin Deutsch, Ioana Manolescu, Stamatis Zampetakis. Towards Scalable Hybrid Stores: Constraint-Based Rewriting to the Rescue. SIGMOD 2019 - ACM SIGMOD International Conference on Management of Data, Jun 2019, Amsterdam, Netherlands. ⟨hal-02070827v2⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Davide Azzalini, Fabio Azzalini, Mirjana Mazuran, Letizia Tanca. Evolution of Financial Time Series Clusters (Discussion Paper). SEBD 2019 - 27th Italian Symposium on Advanced Database Systems, Jun 2019, Castiglione della Pescaia (Grosseto), Italy. ⟨hal-02191794⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Maxime Buron, François Goasdoué, Ioana Manolescu, Marie-Laure Mugnier. Reformulation-based query answering for RDF graphs with RDFS ontologies. ESWC 2019 - 16th European Semantic Web Conference, Jun 2019, Portoroz, Slovenia. pp.19-35, ⟨10.1007/978-3-030-21348-0_2⟩. ⟨hal-02051413⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Tien-Duc Cao, Ludivine Duroyon, François Goasdoué, Ioana Manolescu, Xavier Tannier. BeLink: Querying Networks of Facts, Statements and Beliefs. CIKM 2019 - 28th ACM International Conference on Information and Knowledge Management, Nov 2019, Beijing, China. ⟨10.1145/3357384.3357851⟩. ⟨hal-02269134⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Luciano Di Palma, Yanlei Diao, Anna Liu. A Factorized Version Space Algorithm for "Human-In-the-Loop" Data Exploration. ICDM - 19th IEEE International Conference in Data Mining, Nov 2019, Beijing, China. ⟨hal-02274497v2⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Tien Duc Cao, Ioana Manolescu, Xavier Tannier. Extracting statistical mentions from textual claims to provide trusted content. NLDB 2019 - 24th International Conference on Applications of Natural Language to Information Systems, Jun 2019, Salford, United Kingdom. ⟨hal-02121389⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Ludivine Duroyon, François Goasdoué, Ioana Manolescu. A Linked Data Model for Facts, Statements and Beliefs. The Web Conference 2019 - International Workshop on Misinformation, Computational Fact-Checking and Credible Web, May 2019, San Francisco, United States. ⟨10.1145/3308560.3316737⟩. ⟨hal-02057980⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- François Goasdoué, Pawel Guzewicz, Ioana Manolescu. Incremental structural summarization of RDF graphs. EDBT 2019 - 22nd International Conference on Extending Database Technology, Mar 2019, Lisbon, Portugal. ⟨hal-01978784⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Pawel Guzewicz, Ioana Manolescu. Parallel Quotient Summarization of RDF Graphs. SBD 2019 - International Workshop on Semantic Big Data, Jun 2019, Amsterdam, Netherlands. ⟨10.1145/3323878.3325809⟩. ⟨hal-02106521⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Haridimos Kondylakis, Dimitris Kotzinos, Ioana Manolescu. RDF graph summarization: principles, techniques and applications (tutorial). EDBT/ICDT 2019 - 22nd International Conference on Extending Database Technology - Joint Conference, Mar 2019, Lisbonne, Portugal. ⟨hal-02081474⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Ioana Manolescu, Mirjana Mazuran. Speeding up RDF aggregate discovery through sampling. BigVis 2019 - 2nd International Workshop on Big Data Visual Exploration and Analytics, Mar 2019, Lisbon, Portugal. ⟨hal-02065993⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Letizia Tanca, Davide Azzalini, Fabio Azzalini, Mirjana Mazuran. Tracking the Evolution of Financial Time Series Clusters. DSMM 2019 - 5th Workshop on Data Science for Macro-modeling with Financial and Economic Datasets, Jun 2019, Amsterdam, Netherlands. ⟨hal-02191810⟩
- Accès au texte intégral et bibtex
-
2018
- ref_biblio
- Maxime Buron, François Goasdoué, Ioana Manolescu, Marie-Laure Mugnier. Rewriting-Based Query Answering for Semantic Data Integration Systems. BDA: Gestion de Données – Principes, Technologies et Applications, Oct 2018, Bucarest, Romania. ⟨hal-01927282⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Tien-Duc Cao, Ioana Manolescu, Xavier Tannier. Extracting Linked Data from statistic spreadsheets. Conférence sur la Gestion de Données – Principes, Technologies et Applications, Oct 2018, Bucarest, Romania. ⟨hal-01915148⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Tien-Duc Cao, Ioana Manolescu, Xavier Tannier. Searching for Truth in a Database of Statistics. WebDB 2018 - 21st International Workshop on the Web and Databases, Jun 2018, Houston, United States. pp.1-6. ⟨hal-01745768⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Sylvie Cazalens, Philippe Lamarre, Julien Leblay, Ioana Manolescu, Xavier Tannier. A Content Management Perspective on Fact-Checking. The Web Conference 2018 - alternate paper tracks "Journalism, Misinformation and Fact Checking", Apr 2018, Lyon, France. pp.565-574. ⟨hal-01722666⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Camille Chanial, Rédouane Dziri, Helena Galhardas, Julien Leblay, Minh-Huong Le Nguyen, et al.. ConnectionLens: Finding Connections Across Heterogeneous Data Sources. 34ème Conférence sur la Gestion de Données – Principes, Technologies et Applications, Oct 2018, Bucarest, Romania. ⟨hal-01968418⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Pawel Guzewicz, Ioana Manolescu. Quotient RDF Summaries Based on Type Hierarchies. DESWeb'2018 - Data Engineering meets the Semantic Web 2018, Apr 2018, Paris, France. ⟨hal-01721163v2⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Julien Leblay, Ioana Manolescu, Xavier Tannier. Computational fact-checking: Problems, state of the art, and perspectives. The Web Conference, Apr 2018, Lyon, France. ⟨hal-01791232⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Emmanuel Pietriga, Hande Gözükan, Caroline Appert, Marie Destandau, Šejla Čebirić, et al.. Browsing Linked Data Catalogs with LODAtlas. ISWC 2018 - 17th International Semantic Web Conference, Oct 2018, Monterey, United States. pp.137-153, ⟨10.1007/978-3-030-00668-6_9⟩. ⟨hal-01827766⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Fei Song, Boyao Zhou, Quan Sun, Wang Sun, Shiwen Xia, et al.. Anomaly Detection and Explanation Discovery on Event Streams. BIRTE2018, Aug 2018, RIO, Brazil. ⟨hal-01970660⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Fei Song, Arnaud Stiegler, Yanlei Diao, Jesse Read, Albert Bifet. EXAD: A System for Explainable Anomaly Detection on Big Data Traces. ICDMW 2018 - IEEE International Conference on Data Mining Workshops, Nov 2018, Singapore, Singapore. ⟨hal-02264598⟩
- Accès au texte intégral et bibtex
-
2017
- ref_biblio
- Jean-François Baget, Meghyn Bienvenu, Marie-Laure Mugnier, Michaël Thomazo. Answering Conjunctive Regular Path Queries over Guarded Existential Rules. IJCAI: International Joint Conference on Artificial Intelligence, Aug 2017, Melbourne, Australia. ⟨lirmm-01632224⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Tien Duc Cao, Ioana Manolescu, Xavier Tannier. Extracting linked data from statistic spreadsheets. International Workshop on Semantic Big Data, May 2017, Chicago, United States. pp.1 - 5, ⟨10.1145/3066911.3066914⟩. ⟨hal-01583975⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Šejla Čebirić, François Goasdoué, Ioana Manolescu. A Framework for Efficient Representative Summarization of RDF Graphs. International Semantic Web Conference (ISWC), Oct 2017, Vienna, Austria. ⟨hal-01577778⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Yanlei Diao, Ioana Manolescu, Shu Shang. Dagger: Digging for Interesting Aggregates in RDF Graphs. International Semantic Web Conference (ISWC), Oct 2017, Vienna, Austria. ⟨hal-01577464⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Abhishek Roy, Yanlei Diao, Uday Evani, Avinash Abhyankar, Clinton Howarth, et al.. Massively Parallel Processing of Whole Genome Sequence Data: An In-Depth Performance Study. SIGMOD '17 - ACM International Conference on Management of Data, SIGMOD ACM Special Interest Group on Management of Data, May 2017, Chicago, Illinois, United States. pp.187-202, ⟨10.1145/3035918.3064048⟩. ⟨hal-01683398⟩
- Accès au bibtex
-
2016
- ref_biblio
- Rana B. Al-Otaibi, Francesca Bugiotti, Damian Bursztyn, Alin Deutsch, Ioana Manolescu, et al.. Estocada: Stockage Hybride et Ré-écriture sous Contraintes d'Intégrité. BDA: Conférence sur la Gestion de Données, Nov 2016, Poitiers, France. ⟨hal-01355933⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Meghyn Bienvenu, Michaël Thomazo. On the Complexity of Evaluating Regular Path Queries over Linear Existential Rules. RR: Web Reasoning and Rule Systems, Sep 2016, Aberdeen, United Kingdom. pp.1-17, ⟨10.1007/978-3-319-45276-0_1⟩. ⟨hal-01341787⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Raphaël Bonaque, Bogdan Cautis, François Goasdoué, Ioana Manolescu. Recherche Sociale, Structurée et Sémantique. 32ème Conférence sur la Gestion de Données - Principes, Technologies et Applications, Nov 2016, Poitiers, France. ⟨hal-01426532⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Raphaël Bonaque, Tien Duc Cao, Bogdan Cautis, François Goasdoué, Javier Letelier, et al.. Mixed-instance querying: a lightweight integration architecture for data journalism. VLDB, Sep 2016, New Delhi, India. ⟨hal-01321201v2⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Raphaël Bonaque, Bogdan Cautis, François Goasdoué, Ioana Manolescu. Social, Structured and Semantic Search. International Conference on Extending Database Technology, Mar 2016, Bordeaux, France. ⟨hal-01277939⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Francesca Bugiotti, Damian Bursztyn, Alin Deutsch, Ioana Manolescu, Stamatis Zampetakis. Flexible Hybrid Stores: Constraint-Based Rewriting to the Rescue. 32nd IEEE International Conference on Data Engineering, May 2016, Helsinki, Finland. ⟨hal-01321138⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Damian Bursztyn, François Goasdoué, Ioana Manolescu. Teaching an RDBMS about ontological constraints. Very Large Data Bases, Sep 2016, New Delhi, India. ⟨hal-01354592⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Damian Bursztyn, François Goasdoué, Ioana Manolescu. Optimizing FOL reducible query answering: understanding performance challenges. ISWC 2016: The 15th International Semantic Web Conference, Oct 2016, Kobe, Japan. ⟨hal-01400568⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Jesús Camacho-Rodríguez, Dario Colazzo, Melanie Herschel, Ioana Manolescu, Soudip Roy Chowdhury. Reuse-based Optimization for Pig Latin. 25th ACM International on Conference on Information and Knowledge Management, Oct 2016, Indianapolis, United States. pp.2215 - 2220, ⟨10.1145/2983323.2983669⟩. ⟨hal-01425321⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Šejla Čebirić, François Goasdoué, Ioana Manolescu. Query-Oriented Summarization of RDF Graphs. BDA (Bases de Données Avancées), Nov 2016, Poitiers, France. ⟨hal-01363625⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Markus Krötzsch, Tomáš Masopust, Michaël Thomazo. On the Complexity of Universality for Partially Ordered NFAs . 41st International Symposium on Mathematical Foundations of Computer Science , Aug 2016, Krakow, Poland. ⟨10.4230/LIPIcs.MFCS.2016.62⟩. ⟨hal-01334958⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Sebastian Rudolph, Michaël Thomazo. Expressivity of Datalog Variants – Completing the Picture. 25th International Joint Conference on Artificial Intelligence, Jul 2016, New-York, United States. ⟨hal-01302832⟩
- Accès au texte intégral et bibtex
-
Book sections
2022
- ref_biblio
- Théo Bouganim, Helena Galhardas, Ioana Manolescu. Efficiently Identifying Disguised Missing Values in Heterogeneous, Text-Rich Data. Transactions on Large-Scale Data- and Knowledge-Centered Systems LI, 13410, Springer Berlin Heidelberg, pp.97-118, 2022, Lecture Notes in Computer Science, ⟨10.1007/978-3-662-66111-6_4⟩. ⟨hal-03817900⟩
- Accès au texte intégral et bibtex
-
Master thesis
2021
- ref_biblio
- Abdenour Chaoui. Improving a Search Engine for Answering User Questions in Natural Language. Artificial Intelligence [cs.AI]. 2021. ⟨hal-03524281⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Thomas Meunier. Automatic or semi-automatic detection of companies in difficulty or weakened by the crisis. Artificial Intelligence [cs.AI]. 2021. ⟨hal-03523010⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Maya Touzari. Réalisation d’un système Q&A spécialisé dans la qualité des eaux. Intelligence artificielle [cs.AI]. 2021. ⟨hal-03523094⟩
- Accès au texte intégral et bibtex
-
2018
- ref_biblio
- Pawel Guzewicz. Internship report: Quotient RDF graph summarization. Databases [cs.DB]. 2018. ⟨hal-01879898⟩
- Accès au texte intégral et bibtex
-
2017
- ref_biblio
- Maxime Buron. Grouping Answers in Ontology-Based Query Answering. Logic in Computer Science [cs.LO]. 2017. ⟨hal-01622564v2⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Alexandre Sevin. Creation of a smart representation of pictures for interactive data exploration. Machine Learning [cs.LG]. 2017. ⟨hal-01643077⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Shu Shang. Exploratory Analytics for RDF Graphs. Databases [cs.DB]. 2017. ⟨hal-01657163⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Khaled Zaouk. Performance Modeling and Multi-Objective Optimization for Data Analytics in the Cloud. Computer Science [cs]. 2017. ⟨hal-01647208⟩
- Accès au texte intégral et bibtex
-
Other publications
2020
- ref_biblio
- Oana Balalau, Catarina Conceição, Helena Galhardas, Ioana Manolescu, Tayeb Merabti, et al.. Graph integration of structured, semistructured and unstructured data for data journalism. 36ème Conférence sur la Gestion de Données – Principes, Technologies et Applications (informal publication only), 2020. ⟨hal-02904797v2⟩
- Accès au texte intégral et bibtex
-
2019
- ref_biblio
- Enhui Huang, Luciano Di Palma, Laurent Cetinsoy, Yanlei Diao, Anna Liu. AIDEme: An active learning based system for interactive exploration of large datasets. 2019. ⟨hal-02430750⟩
- Accès au texte intégral et bibtex
-
Documents associated with scientific events
2019
- ref_biblio
- Ioana Manolescu. Computational fact-checking: Problems, state of the art and perspectives. 19e Conférence Francophone sur l'Extraction et Gestion de Connaissances (EGC), Jan 2019, Metz, France. . ⟨hal-01995318⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Ioana Manolescu. Journalistic Dataspaces: Data Management for Journalism and Fact-Checking (Keynote Talk). EDBT/ICDT 2019 Joint Conference, Mar 2019, Lisbonne, Portugal. ⟨hal-02081430⟩
- Accès au texte intégral et bibtex
-
2018
- ref_biblio
- Ioana Manolescu. Democracy Big Bang: What data management can(not) do for journalism. 34ème Conférence sur la Gestion de Données – Principes, Technologies et Applications, Oct 2018, Bucarest, Romania. , 2018. ⟨hal-01968347⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Ioana Manolescu. Structural Summarization of Semantic Graphs. Extended Semantic Web Conference (ESWC) , Jun 2018, Heraklion, Greece. . ⟨hal-01808737⟩
- Accès au texte intégral et bibtex
-
2017
- ref_biblio
- Ioana Manolescu. Data Discovery in RDF Graphs. DEXA 2017 - 28th International Conference on Database and Expert System Applications, Aug 2017, Lyon, France. pp.1-63. ⟨hal-01657144⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Ioana Manolescu. Data integration for journalism: goals, tools, and architectures (Keynote). iiWAS 2017 - 19th International Conference on Information Integration and Web-based Applications & Services, Dec 2017, Salzbourg, Germany. pp.1-46. ⟨hal-01657152⟩
- Accès au texte intégral et bibtex
-
Proceedings
2016
- ref_biblio
- Evaggelia Pitoura, Sofian Maabout, Georgia Koutrika, Amélie Marian, Letizia Tanca, et al.. Proceedings of the 19th International Conference on Extending Database Technology, EDBT . International Conference on Extending Database Technology, Mar 2016, Bordeaux, France. OpenProceedings.org, 2016, 978-3-89318-070-7. ⟨hal-01285191⟩
- Accès au bibtex
-
Reports
2023
- ref_biblio
- Angelos Christos Anadiotis, Ioana Manolescu, Madhulika Mohanty. Integrating Connection Search in Graph Queries. Inria Saclay - Île de France. 2023. ⟨hal-03923293v2⟩
- Accès au texte intégral et bibtex
-
2020
- ref_biblio
- Didier Bazalgette, Jean Langlois-Berthelot. A valuable tool for digital investigation; Operational Approach to Computational Stylometry: Report (Reserved and/or Confidential). Institut Polytechnique de Paris; Ecole Polytechnique; INRIA; Agence Innovation Défense; DGA; DGE. 2020. ⟨hal-04096629⟩
- Accès au bibtex
-
- ref_biblio
- Didier Bazalgette, Jean Langlois-Berthelot. Comparative analysis of the main tools to fight online disinformation Report (Reserved and/or Confidential). Institut Polytechnique de Paris; INRIA; Agence Innovation Défense. 2020. ⟨hal-04096637⟩
- Accès au bibtex
-
2019
- ref_biblio
- Maxime Buron, François Goasdoué, Ioana Manolescu, Marie-Laure Mugnier. Ontology-Based RDF Integration of Heterogeneous Data. [Technical Report] LIX, Ecole polytechnique; Inria Saclay. 2019. ⟨hal-02266517⟩
- Accès au texte intégral et bibtex
-
2018
- ref_biblio
- Šejla Čebirić, François Goasdoué, Pawel Guzewicz, Ioana Manolescu. Compact Summaries of Rich Heterogeneous Graphs. [Research Report] RR-8920, INRIA Saclay; Université Rennes 1. 2018, pp.1-40. ⟨hal-01325900v6⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Enhui Huang, Liping Peng, Luciano Di Palma, Ahmed Abdelkafi, Anna Liu, et al.. Optimization for Active Learning-based Interactive Database Exploration. [Technical Report] Ecole Polytechnique; University of Massachusetts Amherst. 2018. ⟨hal-01870560⟩
- Accès au texte intégral et bibtex
-
2017
- ref_biblio
- Tien Duc Cao, Ioana Manolescu, Xavier Tannier. Extracting Linked Data from statistic spreadsheets. [Research Report] Inria Saclay Ile de France. 2017. ⟨hal-01496700⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Šejla Čebirić, François Goasdoué, Ioana Manolescu. A Framework for Efficient Representative Summarization of RDF Graphs. [Research Report] RR-9090, Inria Saclay Ile de France; Ecole Polytechnique,; Université de Rennes 1 [UR1]. 2017, pp.11. ⟨hal-01577431⟩
- Accès au texte intégral et bibtex
-
2016
- ref_biblio
- Damian Bursztyn, François Goasdoué, Ioana Manolescu. Efficient query answering in the presence of DL-LiteR constraints. [Research Report] RR-8714, INRIA Saclay; INRIA. 2016. ⟨hal-01143498v4⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Jesús Camacho-Rodríguez, Dario Colazzo, Melanie Herschel, Ioana Manolescu, Soudip Roy Chowdhury. PigReuse: A Reuse-based Optimizer for Pig Latin. [Technical Report] Inria Saclay. 2016. ⟨hal-01353891⟩
- Accès au texte intégral et bibtex
-
Theses
2021
- ref_biblio
- Luciano Di Palma. New Algorithms and Optimizations for Human-in-the-Loop Model Development. Machine Learning [cs.LG]. Institut Polytechnique de Paris, 2021. English. ⟨NNT : 2021IPPAX043⟩. ⟨tel-03319743v2⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Pawel Guzewicz. ExpRalytics: Expressive and Efficient Analytics for RDF Graphs. Databases [cs.DB]. École polytechnique, 2021. English. ⟨NNT : ⟩. ⟨tel-03478282v2⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Enhui Huang. Active Learning Methods for Interactive Exploration on Large Databases. Machine Learning [cs.LG]. Institut Polytechnique de Paris, 2021. English. ⟨NNT : 2021IPPAX046⟩. ⟨tel-03339951v2⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Khaled Zaouk. Neural-Based Modeling for Performance Tuning of Cloud Data Analytics. Distributed, Parallel, and Cluster Computing [cs.DC]. Institut Polytechnique de Paris, 2021. English. ⟨NNT : 2021IPPAX016⟩. ⟨tel-03284173⟩
- Accès au texte intégral et bibtex
-
2020
- ref_biblio
- Maxime Buron. Efficient reasoning on large and heterogeneous graphs. Artificial Intelligence [cs.AI]. École Polytechnique, 2020. English. ⟨NNT : ⟩. ⟨tel-03107689⟩
- Accès au texte intégral et bibtex
-
Preprints, Working Papers, ...
2021
- ref_biblio
- Khaled Zaouk, Fei Song, Chenghao Lyu, Yanlei Diao. Neural-based Modeling for Performance Tuning of Spark Data Analytics. 2021. ⟨hal-03116831⟩
- Accès au texte intégral et bibtex
-
2020
- ref_biblio
- Felipe Cordeiro, Helena Galhardas, Julien Leblay, Ioana Manolescu, Tayeb Merabti. Keyword Search in Heterogeneous Data Sources. 2020. ⟨hal-02559688⟩
- Accès au texte intégral et bibtex
-
- ref_biblio
- Luciano Di Palma, Yanlei Diao, Anna Liu. Efficient Version Space Algorithms for "Human-in-the-Loop" Model Development. 2020. ⟨hal-03064769⟩
- Accès au texte intégral et bibtex
-
2018
- ref_biblio
- Isak Czeresnia Etinger. Summary-based optimization in semantic graph databases. 2018. ⟨hal-01742495⟩
- Accès au texte intégral et bibtex
-