Gene EcolC_0333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0333
Symbol
ID	6065569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	385116
End bp	386342
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	54%
IMG OID	641599732
Product	putative mutase
Protein accession	YP_001723338
Protein GI	170018384
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1015] Phosphopentomutase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.520209
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCGAT TTGTGGTGTT AGTGATTGAT AGCTTTGGCG TAGGGGCAAT GAAAGATGTC 
ACGCTGGTGC GTCCGCAAGA TGCGGGAGCG AATACATGTG GTCACATCCT GAGCCAGTTG 
CCGCATTTGC AGCTACCAAC GCTGGAGAAG CTGGGGCTAA TCAACGCATT GGGTTATGCG 
CCAGGCGATA TGCAGCCGTC AGATTCCGCA ACCTGGGGCG TGGCAGAGCT GCAACATGAA 
GGTGGCGATA CCTTTATGGG GCATCAGGAA ATTTTAGGCA CGCGCCCGTT ACCGCCGCTG 
CGGATGCCTT TTCGCGATGT GATTGACCGT GTTGAGCAGG CATTAGTTTC CGCTGGCTGG 
CAGGTGGAGC GCCGTGGCGA TGATCTGCAA TTTCTGTGGG TCAATCAGGC GGTTGCGATT 
GGCGATAATC TCGAGGCGGA TTTAGGCCAG GTCTATAACA TTACCGCCAA TCTCTCTGTG 
ATCTCTTTTG ACGACGCAAT CAAAATTGGT CGTATCGTGC GTGAGCAGGT ACAGGTCGGT 
CGGGTCATTA CATTTGGTGG CCTGTTAACC GACAGTCAAC GCATTCTCGA TGCCGCAGAA 
AGCAAAGAAG GGCGCTTTAT TGGTATCAAT GCGCCGCGTT CTGGCGCTTA TGACAACGGT 
TTCCAGGTCG TGCATATGGG CTATGGCGTC GATGAAAAAG TGCAGGTGCC ACAAAAACTG 
TATGAAGCAG GCGTGCCAAC CGTGCTGGTG GGTAAGGTGG CAGATATCGT CAACAATCCT 
TATGGCGTGA GCTGGCAAAA TCTGGTGGAT AGCCAGCGGA TTATGGATAT CACCCTCAAC 
GAATTTAACA CCCATCCGAC GGCGTTTATT TGCACCAACA TTCAGGAAAC CGACCTCGCT 
GGTCATGCAG AAGACGTCGC ACGTTATGCC GAACGTTTGC AGGTCGTTGA CCGTAACCTT 
GCCCGGCTTG TTGAGGCGAT GCAGCCAGAT GATTGCCTGG TCGTGATGGC GGATCACGGC 
AACGATCCGA CCATTGGTCA CAGCCACCAT ACCCGCGAAG TGGTGCCAGT GCTGGTTTAT 
CAGCAAGGGA TGATCGCTAC GCAGCTCGGT GTGCGCACCA CGCTTTCTGA TGTGGGGGCT 
ACCGTGTGTG AATTTTTCCG CGCGCCACCG CCACAAAATG GTCGCTCTTT TCTTTCCTCC 
CTCCGGTTTG CAGGAGACAC CCTATGA

Protein sequence

MARFVVLVID SFGVGAMKDV TLVRPQDAGA NTCGHILSQL PHLQLPTLEK LGLINALGYA 
PGDMQPSDSA TWGVAELQHE GGDTFMGHQE ILGTRPLPPL RMPFRDVIDR VEQALVSAGW 
QVERRGDDLQ FLWVNQAVAI GDNLEADLGQ VYNITANLSV ISFDDAIKIG RIVREQVQVG 
RVITFGGLLT DSQRILDAAE SKEGRFIGIN APRSGAYDNG FQVVHMGYGV DEKVQVPQKL 
YEAGVPTVLV GKVADIVNNP YGVSWQNLVD SQRIMDITLN EFNTHPTAFI CTNIQETDLA 
GHAEDVARYA ERLQVVDRNL ARLVEAMQPD DCLVVMADHG NDPTIGHSHH TREVVPVLVY 
QQGMIATQLG VRTTLSDVGA TVCEFFRAPP PQNGRSFLSS LRFAGDTL