conceptuele zoekmachine en woordenboek van concepten

Ik vraag naar conceptueel zoeken (of conceptgebaseerd zoeken) dat geen documenten op basis van een specifiek woord of zin vindt, maar het geeft relevante documenten terug die conceptueel gerelateerd zijn, ongeacht gedeelde voorwaarden of zelfs een gemeenschappelijke taal.

voorbeeld: als u het trefwoord "BMW" gebruikt, bevatten de resultaten "dure auto's" enzovoort.

Ik heb al een zoekmachine op basis van Apache Solr. nu hoe de conceptuele zoekactie moet worden uitgevoerd en of er woordenboeken van concepten in mijn zoekmachine kunnen worden gebruikt, dus wanneer kan ik het vinden?

1

1 antwoord

Voor dat soort intelligente zoekopdrachten moet je kijken naar machine learning (om je zoekmachine-functionaliteit aan te vullen), want je moet je corpus begrijpen en, wanneer je bevraagd wordt, termen suggereren die soortgelijk zijn aan betekenis/semantisch (niet door Levenshtein afstand ).

Solr en andere zoekmachines zijn niet bedoeld om de gegevens te begrijpen, ze laten je eenvoudig geavanceerde analyse en transformatie toe. AFAIK het verst dat je met zoekmachines kunt doen, is synoniemen gebruiken, maar dat is niet genoeg voor je zaak, toch?

Neem een ​​kijkje op Apache Mahout , Apache UIMA en Apache OpenNLP .

1
toegevoegd
bedankt voor de hulp. Ja, synoniemen is niet voldoende. Ik wil weten hoe ik de computer de gegevens begrijp en de concepten ontleen
toegevoegd de auteur Khadiga Mahmoud Seddik, de bron