Gene EcolC_2017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2017
Symbol
ID	6068008
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2226741
End bp	2227916
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	51%
IMG OID	641601429
Product	mannose-6-phosphate isomerase, class I
Protein accession	YP_001724988
Protein GI	170020034
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1482] Phosphomannose isomerase
TIGRFAM ID	[TIGR00218] mannose-6-phosphate isomerase, class I

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAAAC TCATTAACTC AGTGCAAAAC TATGCCTGGG GCAGCAAAAC GGCGTTGACT 
GAACTTTATG GTATGGAAAA TCCGTCCAGC CAGCCGATGG CCGAGCTGTG GATGGGCGCA 
CATCCGAAAA GCAGTTCACG AGTGCAGAAT GCCGCCGGAG ATATCGTTTC ACTGCGTGAT 
GTGATTGAGA GTGATAAATC GACTCTGCTC GGAGAGGCCG TTGCCAAACG CTTTGGCGAA 
CTGCCTTTCC TGTTCAAAGT ATTATGCGCA GCACAGCCGC TCTCCATTCA GGTTCATCCA 
AACAAACGCA ATTCTGAAAT CGGTTTTGCC AAAGAAAATG CCGCAGGTAT CCCGATGGAT 
GCCGCCGAGC GTAACTATAA AGATCCTAAC CACAAGCCGG AGCTGGTTTT TGCGCTGACG 
CCTTTCCTTG CGATGAACGC GTTTCGTGAG TTTTCCGAGA TTGTCTCCCT ACTCCAGCCA 
GTCGCAGGTG CACATCCGGC AATTGCTCAC TTTTTACAAC AGCCTAATGC CGAACGTTTA 
AGCGAACTGT TCGCCAGCCT GTTGAATATG CAGGGTGAAG AAAAATCCCG CGCGCTGGCG 
ATTTTAAAAT CGGCGCTCGA CAGTCAGCAG GGTGAACCGT GGCAAACGAT TCGTTTAATT 
TCTGAATTTT ACCCGGAAGA CAGCGGCCTG TTCTCCCCGC TGTTACTGAA TGTGGTGAAA 
TTGAATCCTG GCGAAGCGAT GTTCCTGTTC GCTGAAACAC CGCACGCTTA CCTGCAAGGC 
GTGGCGCTGG AAGTGATGGC GAACTCCGAT AACGTGCTGC GTGCGGGTCT GACGCCTAAG 
TACATTGATA TTCCGGAACT GGTTGCCAAT GTGAAATTCG AAGCCAAACC GGCTAACCAG 
TTGTTGACCC AGCCGGTGAA ACAAGGTGCA GAACTGGACT TCCCGATTCC AGTGGATGAT 
TTTGCCTTCT CGCTGCATGA CCTTAGTGAT AAAGAAACCA CCATTAGCCA GCAGAGTGCC 
GCCATTTTGT TCTGCGTCGA AGGCGATGCA ACGTTGTGGA AAGGTTCTCA GCAGTTACAG 
CTTAAACCGG GTGAATCAGC GTTTATTGCC GCCAACGAAT CACCGGTGAC TGTCAAAGGC 
CACGGCCGTT TAGCGCGTGT TTACAACAAG CTGTAA

Protein sequence

MQKLINSVQN YAWGSKTALT ELYGMENPSS QPMAELWMGA HPKSSSRVQN AAGDIVSLRD 
VIESDKSTLL GEAVAKRFGE LPFLFKVLCA AQPLSIQVHP NKRNSEIGFA KENAAGIPMD 
AAERNYKDPN HKPELVFALT PFLAMNAFRE FSEIVSLLQP VAGAHPAIAH FLQQPNAERL 
SELFASLLNM QGEEKSRALA ILKSALDSQQ GEPWQTIRLI SEFYPEDSGL FSPLLLNVVK 
LNPGEAMFLF AETPHAYLQG VALEVMANSD NVLRAGLTPK YIDIPELVAN VKFEAKPANQ 
LLTQPVKQGA ELDFPIPVDD FAFSLHDLSD KETTISQQSA AILFCVEGDA TLWKGSQQLQ 
LKPGESAFIA ANESPVTVKG HGRLARVYNK L