Gene EcSMS35_1576 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1576
Symbol	add
ID	6144345
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1559430
End bp	1560431
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	54%
IMG OID	641616453
Product	adenosine deaminase
Protein accession	YP_001743631
Protein GI	170684142
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1816] Adenosine deaminase
TIGRFAM ID	[TIGR01430] adenosine deaminase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.859905
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGATA CCACCCTGCC ATTAACTGAT ATCCATCGCC ACCTTGATGG CAACATTCGT 
CCCCAGACCA TTCTTGAACT TGGCCGCCGG TATAATATCT CGCTTCCTGC ACAATCCCTG 
GAAACACTGA TTCCCCACGT TCAGGTCATT GCCAACGAAC CCGATCTTGT GAGCTTTCTG 
ACCAAACTTG ACTGGGGCGT TAAAGTTCTC GCCTCTCTTG ATGCCTGTCG CCGCGTGGCA 
TTTGAAAACA TTGAAGATGC AGCCCGTAAC GGCCTGCACT ATGTCGAGCT GCGTTTTTCA 
CCGGGCTACA TGGCAATGGC ACATCAGCTG CCTGTAGCGG GTGTTGTCGA AGCGGTGATC 
GATGGCGTAC GTGAAGGTTG CCGCACCTTT GGTGTGCAGG CGAAGCTTAT CGGCATTATG 
AGCCGGACCT TCGGTGAAGC CGCCTGTCAG CAAGAGCTGG AGGCCTTTTT AGCCCACCGT 
GACCAGATTA CCGCACTTGA TTTAGCCGGT GATGAACTTG GTTTCCCGGG AAGTCTGTTC 
CTTTCTCACT TCAACCGCGC GCGTGATGCG GACTGGCATA TTACCGTCCA TGCAGGCGAA 
GCTGCCGGGC CGGAAAGCAT CTGGCAGGCG ATTCGTGAAC TGGGGGCGGA ACGTATTGGA 
CATGGCGTAA AAGCCATTGA AGATCGGGCG CTGATGGATT TTCTCGCCGA GCAGCAAATT 
GGTATTGAAT CCTGTCTGAC CTCCAATATT CAGACCAGCA CCGTGGCAGA GCTGGCGGCA 
CATCCGCTGA AAATGTTCCT TGAGCATGGC ATTCGTGCCA GCATTAACAC TGACGATCCC 
GGCGTACAGG GAGTGGATAT CATTCACGAA TATACCGTTG CCGCGCCGGC TGCTGGGTTA 
TCCCGCGAGC AAATCCGCCA GGCGCAGATT AATGGTCTGG AAATGGCTTT CCTCAGCGCA 
GAGGAAAAAC GCGCACTGCG AGAAAAAGTC GCTGCGAAGT AA

Protein sequence

MIDTTLPLTD IHRHLDGNIR PQTILELGRR YNISLPAQSL ETLIPHVQVI ANEPDLVSFL 
TKLDWGVKVL ASLDACRRVA FENIEDAARN GLHYVELRFS PGYMAMAHQL PVAGVVEAVI 
DGVREGCRTF GVQAKLIGIM SRTFGEAACQ QELEAFLAHR DQITALDLAG DELGFPGSLF 
LSHFNRARDA DWHITVHAGE AAGPESIWQA IRELGAERIG HGVKAIEDRA LMDFLAEQQI 
GIESCLTSNI QTSTVAELAA HPLKMFLEHG IRASINTDDP GVQGVDIIHE YTVAAPAAGL 
SREQIRQAQI NGLEMAFLSA EEKRALREKV AAK