How to make Solr search in Case insensitive?

Question

I use apache solr 8.7 Version.

This is my managed-schema code for case insensitive search. But it not properly worked.

 <fieldType name="text_en_splitting" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="true">
      <analyzer type="index">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <!-- in this example, we will only use synonyms at query time
        <filter class="solr.SynonymGraphFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/>
        -->
        <!-- Case insensitive stop word removal.
        -->
        <filter class="solr.StopFilterFactory"
                ignoreCase="true"
                words="lang/stopwords_en.txt"
        />
        <filter class="solr.WordDelimiterGraphFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>
        <filter class="solr.PorterStemFilterFactory"/>
        <filter class="solr.FlattenGraphFilterFactory" />
      </analyzer>

      <analyzer type="query">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.SynonymGraphFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
        <filter class="solr.StopFilterFactory"
                ignoreCase="true"
                words="lang/stopwords_en.txt"
        />
        <filter class="solr.WordDelimiterGraphFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>
        <filter class="solr.PorterStemFilterFactory"/>
      </analyzer>
    </fieldType>

this is some recordes of my database.

enter image description here

I hope help to solve this problem.

Gopal Agarwal · Accepted Answer

If we want to search only on "quality" field, the above field type definition seems over-engineered to me and hence resulting in unintended results.

I would suggest start with minimum needed field type definition like the following and then keep adding as per requirements like Stemming or Alphanumeric or Synonym search:

      <analyzer type="index">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
      </analyzer>

      <analyzer type="query">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
      </analyzer>
    </fieldType>

This is a bottom up approach and it works best when you are working with something new and with lot of unknown variables.

Every filterfactory in the question has a specific purpose, so use only if you have a requirement for it.

All solr filter factories: https://solr.apache.org/guide/8_5/filter-descriptions.html

How to make Solr search in Case insensitive?

Tags:

case-insensitive

full-text-search

solr

solr4

rocky

1 Answers

Gopal Agarwal

Recent Activity

Donate For Us

How to make Solr search in Case insensitive?

Tags:

case-insensitive

full-text-search

solr

solr4

rocky

1 Answers

Gopal Agarwal

Related questions

Recent Activity

Donate For Us