Gene SNSL254_A4867 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4867
Symbol	iadA
ID	6485604
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	4735493
End bp	4736665
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	60%
IMG OID	642740078
Product	isoaspartyl dipeptidase
Protein accession	YP_002043755
Protein GI	194443837
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR01975] isoaspartyl dipeptidase IadA

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	0.567438
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGATT TATCCGCCGC GGAGTTTACC TTATTACAGG GTGCGCACCT GTTTGCGCCA 
GAAGACCGGG GCATCTGCGA TGTTCTGCTC GCGAATGGCA AAATTATTGC CGTCGGCGCT 
GACATCCCCA GCGATATCGT ACCGGACTGT GCGGTGATTA ATCTTAGCGG TCGTATGCTG 
TGCCCGGGCT TTATCGACCA ACACGTTCAT CTGATCGGCG GCGGCGGCGA AGCGGGGCCG 
ACGACGCGGA CGCCGGAAGT CTCCCTGAGC CGCCTGACGG AAGCCGGGAT AACAACGGTC 
GTCGGCCTGC TTGGCACCGA CTCCGTCAGC CGTCATCCCG CGTCGCTGTT AGCCAAAACG 
CGAGCGCTAA ATGAGGAGGG GATCACCGCC TGGATGCTCA CGGGCGCTTA TCACGTTCCG 
TCGCCGACCA TTACTGGCTC GGTAGAAAAA GACGTCGCGC TGATCGATCG CGTCATTGGC 
GTGAAATGCG CAGTCTCCGA CCACCGTTCC GCCGCGCCCA GCGGGAATCA ACTCGCCAGC 
ATGGCCGCTG AATCACGCGT TGGCGGCCTG CTGGGCGGCA AACCCGGTGT CAGCGTTTTT 
CATATGGGCA GCAGCAAAAA AGGGTTACAG CCGCTGTATG ACATCCTGGA AAACAGCGAC 
GTGCCGATCG GTAAACTGCT GCCTACCCAC GTCAACCGTA GCGAATCACT TTTCGAGCAG 
GCGCTGGCGT TTGCGCTTAA AGGCGGCGTG ATCGACATTA CCACCAGTAT CCCGGATCCC 
GTCGCGCCGG CGGAGGGCAT TGCCAGAGCG GTAAAAGCCG GCGTCCCGCT TTCCCGGGTG 
ACGCTCAGTT CAGACGGTAA CGGCAGCCAG CCGCTATTTG ACGCTGCCGG AAATCTGACG 
GGCATCGGCG TCGCGGGCTT CGAAAGTTTG CTGGAGACGT TGCAGACGCT GGTTAATCAC 
TACGGATTCA GCCTGACCGA TGCTCTGCGT CCGCTGACGA CCAGCGTAGC CGCCTTCCTC 
AGTCTGGACG GCAAAGGCGA AATCCGTCCC GGTAACGATG CGGATCTGCT CGTCTTTAGC 
GCAGATTTAC GTATTGAGCA GGTGTATGCG CGCGGCAAAC GCATGGTCAA TGAGGGGAAA 
GCCTGCGTAA AAGGTACCTT TGAACCGGCG TAA

Protein sequence

MPDLSAAEFT LLQGAHLFAP EDRGICDVLL ANGKIIAVGA DIPSDIVPDC AVINLSGRML 
CPGFIDQHVH LIGGGGEAGP TTRTPEVSLS RLTEAGITTV VGLLGTDSVS RHPASLLAKT 
RALNEEGITA WMLTGAYHVP SPTITGSVEK DVALIDRVIG VKCAVSDHRS AAPSGNQLAS 
MAAESRVGGL LGGKPGVSVF HMGSSKKGLQ PLYDILENSD VPIGKLLPTH VNRSESLFEQ 
ALAFALKGGV IDITTSIPDP VAPAEGIARA VKAGVPLSRV TLSSDGNGSQ PLFDAAGNLT 
GIGVAGFESL LETLQTLVNH YGFSLTDALR PLTTSVAAFL SLDGKGEIRP GNDADLLVFS 
ADLRIEQVYA RGKRMVNEGK ACVKGTFEPA