Gene EcHS_A0735 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0735
Symbol	pgm
ID	5595392
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	743912
End bp	745552
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	55%
IMG OID	640919912
Product	phosphoglucomutase
Protein accession	YP_001457486
Protein GI	157160168
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0033] Phosphoglucomutase
TIGRFAM ID	[TIGR01132] phosphoglucomutase, alpha-D-glucose phosphate-specific

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00000000226072
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAATCC ACAATCGTGC AGGCCAACCT GCACAACAGA GTGATTTGAT TAACGTCGCC 
CAACTGACGG CGCAATATTA TGTACTGAAA CCAGAAGCAG GGAATGCGGA GCACGCGGTG 
AAATTCGGTA CTTCCGGTCA CCGTGGCAGT GCAGCGCGCC ACAGCTTTAA CGAGCCGCAC 
ATTCTGGCGA TCGCTCAGGC AATTGCTGAA GAACGTGCGA AAAACGGCAT CACTGGCCCT 
TGCTATGTGG GTAAAGATAC TCACGCCCTG TCCGAGCCTG CGTTCATTTC CGTACTGGAA 
GTGCTGGCAG CGAACGGCGT TGATGTCATT GTGCAGGAAA ACAATGGCTT CACTCCAACG 
CCTGCCGTTT CCAATGCCAT CCTGGTTCAC AATAAAAAAG GTGGCCCGCT GGCAGACGGT 
ATCGTGATTA CACCGTCCCA TAACCCGCCG GAAGATGGTG GTATCAAGTA CAATCCGCCA 
AATGGTGGCC CGGCTGATAC CAACGTCACC AAAGTGGTGG AAGACAGGGC CAACGCACTG 
CTGGCCGATG GCCTGAAAGG CGTGAAGCGT ATCTCCCTCG ACGAAGCGAT GGCATCCGGT 
CATGTGAAAG AGCAGGATCT GGTGCAGCCG TTCGTGGAAG GGCTGGCCGA TATCGTTGAT 
ATGGCGGCGA TTCAGAAAGC GGGCCTGACG CTTGGCGTTG ATCCGCTGGG CGGTTCCGGT 
ATCGAATACT GGAAGCGTAT TGGCGAGTAT TACAACCTCA ACCTGACTAT CGTTAACGAT 
CAGGTCGATC AAACCTTCCG CTTTATGCAC CTTGATAAAG ACGGCGCGAT CCGTATGGAC 
TGCTCCTCCG AGTGTGCGAT GGCGGGCCTG CTGGCACTGC GTGATAAGTT CGATCTGGCG 
TTTGCTAACG ACCCGGATTA TGACCGTCAC GGTATCGTCA CTCCGGCAGG TTTGATGAAT 
CCGAACCACT ACCTGGCGGT GGCGATCAAT TACCTGTTCC AGCATCGTCC GCAGTGGGGC 
AAAGATGTTG CCGTTGGTAA AACGCTGGTT TCTTCTGCGA TGATCGACCG TGTGGTCAAT 
GACTTGGGTC GTAAGCTGGT AGAAGTCCCG GTAGGTTTCA AATGGTTTGT TGATGGTCTG 
TTCGACGGCA GCTTCGGCTT TGGCGGCGAA GAGAGCGCAG GGGCTTCCTT CCTGCGTTTC 
GACGGCACGC CGTGGTCCAC CGACAAAGAC GGCATCATCA TGTGTCTGCT GGCGGCGGAA 
ATCACCGCTG TCACCGGTAA GAACCCGCAG GAACACTACA ACGAACTGGC AAAACGCTTT 
GGTGCGCCGA GCTACAACCG TTTGCAGGCA GCTGCGACTT CCGCACAAAA AGCGGCGCTG 
TCTAAGCTGT CTCCGGAAAT GGTGAGCGCC AGCACCCTGG CAGGTGACCC GATCACCGCG 
CGCCTGACTG CTGCTCCGGG CAACGGTGCT TCTATTGGCG GTCTGAAAGT GATGACTGAC 
AACGGCTGGT TCGCCGCGCG TCCGTCAGGC ACGGAAGACG CATATAAGAT CTACTGCGAA 
AGCTTCCTCG GTGAAGAACA TCGCAAGCAG ATCGAGAAAG AAGCGGTTGA GATTGTTAGC 
GAAGTTCTGA AAAACGCGTA A

Protein sequence

MAIHNRAGQP AQQSDLINVA QLTAQYYVLK PEAGNAEHAV KFGTSGHRGS AARHSFNEPH 
ILAIAQAIAE ERAKNGITGP CYVGKDTHAL SEPAFISVLE VLAANGVDVI VQENNGFTPT 
PAVSNAILVH NKKGGPLADG IVITPSHNPP EDGGIKYNPP NGGPADTNVT KVVEDRANAL 
LADGLKGVKR ISLDEAMASG HVKEQDLVQP FVEGLADIVD MAAIQKAGLT LGVDPLGGSG 
IEYWKRIGEY YNLNLTIVND QVDQTFRFMH LDKDGAIRMD CSSECAMAGL LALRDKFDLA 
FANDPDYDRH GIVTPAGLMN PNHYLAVAIN YLFQHRPQWG KDVAVGKTLV SSAMIDRVVN 
DLGRKLVEVP VGFKWFVDGL FDGSFGFGGE ESAGASFLRF DGTPWSTDKD GIIMCLLAAE 
ITAVTGKNPQ EHYNELAKRF GAPSYNRLQA AATSAQKAAL SKLSPEMVSA STLAGDPITA 
RLTAAPGNGA SIGGLKVMTD NGWFAARPSG TEDAYKIYCE SFLGEEHRKQ IEKEAVEIVS 
EVLKNA