I want to delete duplicated dictionary objects from a List of dictionaries. I don't want the dict element that has the same 'plate' element with another dict element in the list. I want it only once. <pre class="prettyprint"><code>datalist = [ { 'plate': "01", 'confidence' : "80" }, { 'plate': "01", 'confidence' : "60" }, { 'plate': "02", 'confidence' : "91" }, { 'plate': "02", 'confidence' : "91" }, ] </code></pre> My output should be like this: <pre class="prettyprint"><code>datalist = [ { 'plate': "01", 'confidence' : "80" }, { 'plate': "02", 'confidence' : "91" }, ] </code></pre> This is my code, but I'm not getting the exact result. <pre class="prettyprint"><code>def filter(datalist): previous = "" for data in datalist: current = data['plate'] if current is previous: datalist.remove(data) previous = current return datalist datalist = [ { 'plate': "01", 'confidence' : "80" }, { 'plate': "01", 'confidence' : "60" }, { 'plate': "02", 'confidence' : "91" }, { 'plate': "02", 'confidence' : "91" }, ] print (filter(datalist)) </code></pre> This gives me the output: <pre class="prettyprint"><code>[ { 'plate': "01", 'confidence' : "80" }, { 'plate': "02", 'confidence' : "91" }, { 'plate': "02", 'confidence' : "91" }, ] </code></pre> which is not expected, what's wrong with my code.

If any element from the groups of duplicates is acceptable, you could do: <pre class="prettyprint"><code>datalist = [ {'plate': "01", 'confidence': "80"}, {'plate': "01", 'confidence': "60"}, {'plate': "02", 'confidence': "91"}, {'plate': "02", 'confidence': "91"}, ] result = list({ d['plate'] : d for d in datalist }.values()) print(result) </code></pre> Output <pre class="prettyprint"><code>[{'plate': '02', 'confidence': '91'}, {'plate': '01', 'confidence': '60'}] </code></pre> The idea is to create a dictionary where the keys are values of <code>plate</code> and the values are the dictionaries themselves. If you want to keep the first duplicate entries use reversed: <pre class="prettyprint"><code>result = list({d['plate']: d for d in reversed(datalist)}.values()) </code></pre> Output <pre class="prettyprint"><code>[{'plate': '02', 'confidence': '91'}, {'plate': '01', 'confidence': '80'}] </code></pre>

How to delete duplicated dictionary objects from a List of dictionaries

Tags:

python

dictionary

list

I want to delete duplicated dictionary objects from a List of dictionaries. I don't want the dict element that has the same 'plate' element with another dict element in the list. I want it only once.

datalist = [

{
    'plate': "01",
    'confidence' : "80"
},

{
    'plate': "01",
    'confidence' : "60"
},

{
    'plate': "02",
    'confidence' : "91"
},

{
    'plate': "02",
    'confidence' : "91"
},
]

My output should be like this:

datalist = [

{
    'plate': "01",
    'confidence' : "80"
},

{
    'plate': "02",
    'confidence' : "91"
},
]

This is my code, but I'm not getting the exact result.

def filter(datalist):
    previous = ""
    for data in datalist:
        current  = data['plate']
        if current is previous:
            datalist.remove(data)
        previous = current 

    return datalist

datalist = [

    {
        'plate': "01",
        'confidence' : "80"
    },

    {
        'plate': "01",
        'confidence' : "60"
    },

    {
        'plate': "02",
        'confidence' : "91"
    },

    {
        'plate': "02",
        'confidence' : "91"
    },
]


print (filter(datalist))

This gives me the output:

[

    {
        'plate': "01",
        'confidence' : "80"
    },

    {
        'plate': "02",
        'confidence' : "91"
    },

    {
        'plate': "02",
        'confidence' : "91"
    },
]

which is not expected, what's wrong with my code.

544

asked Jan 04 '19 12:01

Khaalidi

4 Answers

If any element from the groups of duplicates is acceptable, you could do:

datalist = [
    {'plate': "01", 'confidence': "80"},
    {'plate': "01", 'confidence': "60"},
    {'plate': "02", 'confidence': "91"},
    {'plate': "02", 'confidence': "91"},
]

result = list({ d['plate'] : d for d in datalist }.values())
print(result)

Output

[{'plate': '02', 'confidence': '91'}, {'plate': '01', 'confidence': '60'}]

The idea is to create a dictionary where the keys are values of plate and the values are the dictionaries themselves. If you want to keep the first duplicate entries use reversed:

result = list({d['plate']: d for d in reversed(datalist)}.values())

Output

[{'plate': '02', 'confidence': '91'}, {'plate': '01', 'confidence': '80'}]

199

answered Dec 12 '22 04:12

Dani Mesejo

You can use the unique_everseen recipe, also available in 3rd party more_itertools:

from more_itertools import unique_everseen
from operator import itemgetter    

datalist = list(unique_everseen(datalist, key=itemgetter('plate')))

Internally, this solution uses set to keep track of seen plates, yielding only dictionaries with new plate values. Therefore, ordering is maintained and only the first instance of any given plate is kept.

answered Dec 12 '22 05:12

jpp

you can also use pandas

import pandas as pd
df = pd.DataFrame(data = datalist)
df.drop_duplicates(subset = ['plate'],keep='first',inplace=True)
output = df.to_dict(orient='record')

keep = 'first' or 'last' will help in which entry to keep in output

answered Dec 12 '22 03:12

LMSharma

If you are a pandas user, you can consider

>>> import pandas as pd
>>> datalist = [{'plate': "01", 'confidence': "80"}, {'plate': "01", 'confidence': "60"}, {'plate': "02", 'confidence': "91"}, {'plate': "02", 'confidence': "91"}]
>>> pd.DataFrame(datalist).drop_duplicates('plate').to_dict(orient='records')                                                                               
[{'confidence': '80', 'plate': '01'}, {'confidence': '91', 'plate': '02'}]

If you want to keep the last seen duplicates, pass keep='last'.

>>> pd.DataFrame(datalist).drop_duplicates('plate', keep='last').to_dict(orient='records')
[{'confidence': '60', 'plate': '01'}, {'confidence': '91', 'plate': '02'}]

answered Dec 12 '22 03:12

timgeb

Related questions
                            
                                Comparing list comprehensions and explicit loops (3 array generators faster than 1 for loop)
                            
                                Pytest setup/teardown hooks for session
                            
                                Keras model.to_json() error: 'rawunicodeescape' codec can't decode bytes in position 94-98: truncated \uXXXX
                            
                                Saving python argparse file
                            
                                MYSQL- python pip install error
                            
                                sort_values() method in pandas
                            
                                Read Value from Config File Python
                            
                                How to restore after accidentally apt-get remove python
                            
                                (Re)Checking Dependencies with PIP
                            
                                AttributeError: module 'matplotlib.pyplot' has no attribute 'xlable'
                            
                                Python open() requires full path
                            
                                Django - Forms - What does (?P<pk>\d+)/$ signify?
                            
                                Replace strings in a list (using re.sub)
                            
                                Discord.py | add role to someone
                            
                                Combine two lists without duplicate values
                            
                                Grouping / Categorising ages column in Python Pandas
                            
                                IPython, "name 'plt' not defined"
                            
                                Returning the three maximal values in a dictionary
                            
                                SQLAlchemy: Get database name from engine
                            
                                Documentation for PyTorch .to('cpu') or .to('cuda')

Donate For Us

If you love us? You can donate to us via Paypal or buy me a coffee so we can maintain and grow! Thank you!

Donate Us With