TREC

Incorporating Non-Relevance Information in the Estimation of Query Models

We describe the participation of the University of Amsterdam’s ILPS group in the relevance feedback track at TREC 2008. We introduce a new model which incorporates information from relevant and non-relevant documents to improve the estimation of query models. Our main findings are twofold: (i) in terms of statMAP, a larger number of judged non-relevant documents improves retrieval effectiveness and (ii) on the TREC Ter- abyte topics, we can effectively replace the estimates on the judged non-relevant documents with estimations on the document collection.

  • [PDF] E. Meij, W. Weerkamp, J. He, and M. de Rijke, “Incorporating non-relevance information in the estimation of query models,” in The seventeenth text retrieval conference, 2009.
    [Bibtex]
    @inproceedings{TREC:2009:meij,
    Abstract = {We describe the participation of the University of Amsterdam's ILPS group in the relevance feedback track at TREC 2008. We introduce a new model which incorporates information from relevant and non-relevant documents to improve the estimation of query models. Our main findings are twofold: (i) in terms of statMAP, a larger number of judged non-relevant documents improves retrieval effectiveness and (ii) on the TREC Terabyte topics, we can effectively replace the estimates on the judged non-relevant documents with estimations on the document collection.},
    Author = {Meij, E. and Weerkamp, W. and He, J. and de Rijke, M.},
    Booktitle = {The Seventeenth Text REtrieval Conference},
    Date-Added = {2011-10-16 16:03:56 +0200},
    Date-Modified = {2012-10-30 09:23:32 +0000},
    Series = {TREC 2008},
    Title = {Incorporating Non-Relevance Information in the Estimation of Query Models},
    Year = {2009}}

AGRO informatica

De Aida toolbox: Een gecombineerde aanpak voor het beheren van kennis

In een computationele netwerk omgeving zoals het grid is een overvloed aan zeer uiteenlopende soorten bronnen aanwezig. Denk bijvoorbeeld aan tijdschrift artikelen, beelden, massa spectrometrie data, R scripts voor statistiek, web services, workflows of spreadsheets. Deze overvloed kan een grote belemmering vormen. Hoe moet een gebruiker de juiste bronnen vinden voor een voorliggend probleem? Vele factoren maken het matchen van de benodigdheden en gebruikerswensen aan wat de bronnen kunnen leveren en de regels ten aanzien van hun gebruik een complex probleem. Het probleem doet zich voor op verschillende niveaus. Eindgebruikers willen het benodigde vinden in hun eigen domein. Applicatie en middelware ontwikkelaars moeten services en data kunnen vinden, bij voorkeur geautomatiseerd zodat veranderingen in aanwezigheid en toegankelijkheid kunnen worden opgevangen. Dit probleem beperkt zich niet tot grids; ook het Web en allerlei dataopslag toepassingen hebben er mee te maken. Ook voor ‘enhanced science’ (e-science) is het beheren van heterogene bronnen een belangrijke uitdaging.

  • [PDF] M. S. Marshall, M. Roos, E. Meij, S. Katrenko, W. R. van Hage, and P. W. Adriaans, “De AIDA toolbox: een gecombineerde aanpak voor het beheren van kennis,” Agro informatica, vol. 21, iss. 4, pp. 5-7, 2009.
    [Bibtex]
    @article{AGRO:2009:marshall,
    Author = {Marshall, M.S. and Roos, M. and Meij, Edgar and Katrenko, S. and van Hage, W.R. and Adriaans, P.W.},
    Date-Added = {2011-10-16 15:55:36 +0200},
    Date-Modified = {2012-10-28 23:04:41 +0000},
    Edition = {1},
    Journal = {Agro Informatica},
    Number = {4},
    Pages = {5--7},
    Title = {De {AIDA} toolbox: Een gecombineerde aanpak voor het beheren van kennis},
    Volume = {21},
    Year = {2009}}