Gene EcHS_A1947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1947
Symbol	pykA
ID	5592954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1956626
End bp	1958068
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	53%
IMG OID	640921092
Product	pyruvate kinase
Protein accession	YP_001458641
Protein GI	157161323
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0469] Pyruvate kinase
TIGRFAM ID	[TIGR01064] pyruvate kinase

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	0.327094
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCAGAA GGCTTCGCAG AACAAAAATC GTTACCACGT TAGGCCCAGC AACAGATCGC 
GATAATAATC TTGAAAAAGT TATCGCGGCG GGTGCCAACG TTGTACGTAT GAACTTTTCT 
CACGGCTCGC CTGAAGATCA CAAAATGCGC GCGGATAAAG TTCGTGAGAT TGCCGCAAAA 
CTGGGGCGTC ATGTGGCTAT TCTGGGTGAC CTCCAGGGGC CCAAAATCCG TGTATCCACC 
TTTAAAGAAG GCAAAGTTTT CCTCAATATT GGGGATAAAT TCCTGCTCGA CGCCAACCTG 
GGTAAAGGTG AAGGCGACAA AGAAAAAGTC GGTATCGACT ACAAAGGCCT GCCTGCTGAC 
GTCGTGCCTG GTGACATCCT GCTGCTGGAC GATGGTCGCG TCCAGTTAAA AGTACTGGAA 
GTTCAGGGCA TGAAAGTGTT CACCGAAGTC ACCGTCGGTG GTCCCCTCTC CAACAATAAA 
GGTATCAACA AACTTGGCGG CGGTTTGTCG GCTGAAGCGC TGACCGAAAA AGACAAAGCA 
GACATTAAGA CTGCGGCGTT GATTGGCGTA GATTACCTGG CTGTCTCCTT CCCACGCTGT 
GGCGAAGATC TGAACTATGC CCGTCGCCTG GCACGCGATG CAGGATGTGA TGCGAAAATT 
GTTGCCAAGG TTGAACGTGC GGAAGCCGTT TGCAGCCAGG ATGCAATGGA TGACATCATC 
CTCGCCTCTG ACGTGGTAAT GGTTGCACGT GGCGACCTCG GTGTGGAAAT TGGCGACCCG 
GAACTGGTCG GCATTCAGAA AGCGTTGATC CGTCGTGCGC GTCAGCTAAA CCGAGCGGTA 
ATCACGGCGA CCCAGATGAT GGAGTCAATG ATTACTAACC CGATGCCGAC GCGTGCAGAA 
GTCATGGACG TAGCAAACGC CGTTCTGGAT GGTACTGACG CTGTGATGCT GTCTGCAGAA 
ACTGCCGCTG GGCAGTATCC GTCAGAAACC GTTGCAGCCA TGGCGCGCGT TTGCCTGGGT 
GCGGAAAAAA TCCCGAGCAT CAACGTTTCT AAACACCGTC TGGACGTTCA GTTCGACAAT 
GTGGAAGAAG CTATTGCCAT GTCAGCAATG TACGCAGCTA ACCACCTGAA AGGCGTTACG 
GCGATCATCA CCATGACCGA ATCGGGTCGT ACCGCGCTGA TGACCTCCCG TATCAGCTCT 
GGTCTGCCAA TTTTCGCCAT GTCGCGCCAT GAACGTACGC TGAACCTGAC TGCTCTCTAT 
CGTGGCGTTA CGCCGGTGCA CTTTGATAGC GCTAATGACG GCGTAGCAGC TGCCAGCGAA 
GCGGTTAATC TGCTGCGCGA TAAAGGTTAC TTGATGTCTG GTGACCTGGT GATTGTCACC 
CAGGGCGACG TGATGAGTAC CGTGGGTTCT ACTAATACCA CGCGTATTTT AACGGTAGAG 
TAA

Protein sequence

MSRRLRRTKI VTTLGPATDR DNNLEKVIAA GANVVRMNFS HGSPEDHKMR ADKVREIAAK 
LGRHVAILGD LQGPKIRVST FKEGKVFLNI GDKFLLDANL GKGEGDKEKV GIDYKGLPAD 
VVPGDILLLD DGRVQLKVLE VQGMKVFTEV TVGGPLSNNK GINKLGGGLS AEALTEKDKA 
DIKTAALIGV DYLAVSFPRC GEDLNYARRL ARDAGCDAKI VAKVERAEAV CSQDAMDDII 
LASDVVMVAR GDLGVEIGDP ELVGIQKALI RRARQLNRAV ITATQMMESM ITNPMPTRAE 
VMDVANAVLD GTDAVMLSAE TAAGQYPSET VAAMARVCLG AEKIPSINVS KHRLDVQFDN 
VEEAIAMSAM YAANHLKGVT AIITMTESGR TALMTSRISS GLPIFAMSRH ERTLNLTALY 
RGVTPVHFDS ANDGVAAASE AVNLLRDKGY LMSGDLVIVT QGDVMSTVGS TNTTRILTVE