Gene SbBS512_E4777 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4777
Symbol	iadA
ID	6271534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	4457667
End bp	4458839
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	56%
IMG OID	641728529
Product	isoaspartyl dipeptidase
Protein accession	YP_001882924
Protein GI	187732230
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR01975] isoaspartyl dipeptidase IadA

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGATT ATACCGCAGC CGGTTTTACC CTGCTGCAGG GAGCGCATTT GTATGCACCG 
GAAGATCGGG GAATTTGCGA TGTCCTCGTC GCTAACGGCA AAATTATCGC CGTTGCCAGC 
AATATCCCTT CTGACATTGT ACCGAACTGC ACGGTTGTCG ATCTCAGTGG GCAGATCCTC 
TGCCCAGGTT TTATTGATCA ACACGTCCAT TTGATTGGCG GTGGCGGCGA AGCAGGTCCC 
ACGACGCGCA CGCCGGAAGT GGCGCTAAGT CGCCTGACGG AAGCGGGCGT CACGTCAGTG 
GTTGGTCTGC TGGGCACCGA CTCTATCTCT CGCCACCCGG AATCCCTGCT CGCCAAGACC 
CGTGCGCTCA ATGAAGAAGG CATCAGCGCC TGGATGCTGA CCGGCGCTTA TCATGTCCCT 
TCCCGCACTA TTACGGGTTC CGTGGAAAAA GACGTGGCGA TTATCGATCG TGTGATTGGC 
GTGAAATGCG CCATCTCTGA TCACCGTTCT GCCGCACCGG ACGTTTATCA CCTGGCTAAT 
ATGGCGGCAG AATCCCGCGT TGGCGGTTTG CTCGGCAGTA AACCTGGCGT CACCGTGTTC 
CACATGGGCG ACAGTAAAAA GGCGTTACAG CCTATTTATG ACCTGCTGGA AAACTGCGAT 
GTGCCGATCA GCAAGCTGCT GCCGACCCAC GTTAACCGCA ACGTACCGTT GTTTGAGCAG 
GCGCTGGAGT TCGCGCGCAA AGGCGGCACC ATCGATATCA CCAGCAGCAT TGACGAACCG 
GTCGCCCCTG CCGAAGGTAT TGCCCGCGCC GTTCAGGCGG GTATTCCGCT GGCACGCGTC 
ACCCTCAGCT CCGACGGCAA CGGTAGCCAG CCGTTCTTCG ATGACGAAGG GAATTTAACC 
CATATCGGTG TTGCAGGTTT TGAAACGTTG CTGGAAACCG TGCAGGTGCT GGTCAAAGAC 
TATGATTTCA GTATCAGCGA TGCCCTGCGC CCGCTCACCA GTAGCGTAGC CGGTTTCCTT 
AACCTGAGCG GGAAAGGCGA AATTCTGCCT GGCAATGACG CAGACTTACT AGTCATGACG 
CCAGAATTGC GCATTGAGCA GGTATATGCT CGCGGCAAAC TGATGGTCAA AGACGGCAAA 
GCCTGCGTGA AAGGAACGTT TGAAACGGCT TAA

Protein sequence

MIDYTAAGFT LLQGAHLYAP EDRGICDVLV ANGKIIAVAS NIPSDIVPNC TVVDLSGQIL 
CPGFIDQHVH LIGGGGEAGP TTRTPEVALS RLTEAGVTSV VGLLGTDSIS RHPESLLAKT 
RALNEEGISA WMLTGAYHVP SRTITGSVEK DVAIIDRVIG VKCAISDHRS AAPDVYHLAN 
MAAESRVGGL LGSKPGVTVF HMGDSKKALQ PIYDLLENCD VPISKLLPTH VNRNVPLFEQ 
ALEFARKGGT IDITSSIDEP VAPAEGIARA VQAGIPLARV TLSSDGNGSQ PFFDDEGNLT 
HIGVAGFETL LETVQVLVKD YDFSISDALR PLTSSVAGFL NLSGKGEILP GNDADLLVMT 
PELRIEQVYA RGKLMVKDGK ACVKGTFETA