Gene EcolC_2007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2007
Symbol
ID	6068080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2213441
End bp	2214442
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	54%
IMG OID	641601421
Product	adenosine deaminase
Protein accession	YP_001724980
Protein GI	170020026
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1816] Adenosine deaminase
TIGRFAM ID	[TIGR01430] adenosine deaminase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00173018
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.960599
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGATA CCACCCTGCC ATTAACTGAT ATCCATCGCC ACCTTGATGG CAACATTCGT 
CCCCAGACCA TTCTTGAACT TGGCCGCCAG TATAATATCT CGCTTCCTGC ACAATCCCTG 
GAAACACTGA TTCCCCACGT TCAGGTCATT GCCAACGAAC CCGATCTGGT GAGCTTTCTG 
ACCAAACTTG ACTGGGGCGT TAAAGTTCTC GCCTCTCTTG ATGCCTGTCG CCGCGTGGCA 
TTTGAAAACA TTGAAGATGC AGCCCGTCAC GGCCTGCACT ATGTCGAGCT GCGTTTTTCA 
CCAGGCTACA TGGCAATGGC ACATCAGCTG CCTGTAGCGG GTGTTGTCGA AGCGGTGATC 
GATGGCGTAC GTGAAGGTTG CCGCACCTTT GGTGTGCAGG CGAAGCTTAT CGGCATTATG 
AGCCGGACCT TCGGCGAAGC CGCCTGTCAG CAAGAGCTGG AGGCCTTTTT AGCCCACCGT 
GACCAGATTA CCGCACTTGA TTTAGCCGGT GATGAACTTG GTTTCCCGGG AAGTCTGTTC 
CTTTCTCACT TCAACCGCGC GCGTGATGCG GGCTGGCATA TTACCGTCCA TGCAGGCGAA 
GCTGCCGGGC CGGAAAGCAT CTGGCAGGCG ATTCGTGAAC TGGGTGCGGA GCGTATTGGA 
CATGGCGTAA AAGCCATTGA AGATCGGGCG CTGATGGATT TTCTCGCCGA GCAACAAATT 
GGTATTGAAT CCTGTCTGAC CTCCAATATT CAGACCAGCA CCGTAGCAGA GCTGGCTGCA 
CATCCGCTGA AAACGTTCCT TGAGCATGGC ATTCGTGCCA GCATTAACAC TGACGATCCC 
GGCGTACAGG GAGTGGATAT CATTCACGAA TATACCGTTG CCGCGCCAGC TGCTGGGTTA 
TCCCGCGAGC AAATCCGCCA GGCACAGATT AATGGTCTGG AAATGGCTTT CCTCAGCGCT 
GAGGAAAAAC GCGCACTGCG AGAAAAAGTC GCCGCGAAGT AA

Protein sequence

MIDTTLPLTD IHRHLDGNIR PQTILELGRQ YNISLPAQSL ETLIPHVQVI ANEPDLVSFL 
TKLDWGVKVL ASLDACRRVA FENIEDAARH GLHYVELRFS PGYMAMAHQL PVAGVVEAVI 
DGVREGCRTF GVQAKLIGIM SRTFGEAACQ QELEAFLAHR DQITALDLAG DELGFPGSLF 
LSHFNRARDA GWHITVHAGE AAGPESIWQA IRELGAERIG HGVKAIEDRA LMDFLAEQQI 
GIESCLTSNI QTSTVAELAA HPLKTFLEHG IRASINTDDP GVQGVDIIHE YTVAAPAAGL 
SREQIRQAQI NGLEMAFLSA EEKRALREKV AAK