Gene MCA2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA2021
Symbol	pgk
ID	3104829
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	2169482
End bp	2170657
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	65%
IMG OID	637171176
Product	phosphoglycerate kinase
Protein accession	YP_114453
Protein GI	53803689
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0126] 3-phosphoglycerate kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTTCA AACGCATGAC CGACATCGAT CTCGCCGGCA AGCGCGTCCT GATCCGGGAA 
GACTTCAACG TCCCCGTCAA AGATGGCCGG GTCACCAGCG ACGCCCGCAT CCGCGCCGCC 
CTCCCGACCA TCCGCCACGC GCTGGACGCC GGCGCTGCGG TGATGCTGAT GTCGCATCTC 
GGCCGCCCCA CCGAAGGGGA ATATGCCGAG GAGTTTTCCA TGAAACCCGT TGCCGACCGG 
CTGTCCGAAC TATTGGGGCA GCCGGTGACA CTGGTGAAGG ACTACCTGGG TGGCGCCGAC 
CCGGCGGTCG GGTCGGTCGT GCTATTCGAG AACGTGCGTT TCAACAAGGG CGAGAAGAAG 
GACGACGAGG TCTTGGCGCG CCAGCTCGCC GCGCTGTGCG ACGTCTACGT GATGGATGCC 
TTCGGTACGG CGCACCGCGC CGAGGCTTCG ACGCACGGCG TGGGCAAATA CGCTCCCACC 
GCCTGTGCCG GCCTGCTGCT GGCGACGGAA TTGGATGCAC TGGGCAGAGC GCTCCACGAC 
CCGGCGCGCC CCTTGGTCGC CATCGTCGGC GGCTCGAAAG TATCGACCAA ACTGACGGTT 
CTGGATTCCC TTTCGCAGGT GGTCGATCAG CTCATCGTCG GTGGCGGTAT CGCCAACACC 
TTCATCAAAG CCGCCGGCTT CAATGTCGGG AAATCACTGT ACGAGGAGGA CCTGGTGGCC 
GAAGCCAGGC GCCTGATGGA AGCCGCCAAG GCCAAGGGCG GGGAGATCCC CGTACCGGTC 
GACGTGGTGG TCGGCAAACG CTTCGATGCC GCGGAACCCG CCATGGTCAA GAGCGTCGCA 
GACATCGCCG AGGACGACAT GATCCTCGAC ATCGGTCCGG AGACCAGCCG CCGCTACGCC 
GAGTTCATCG GCCGCGCCGG CACGGTGGTC TGGAATGGCC CCGTAGGTGT CTTCGAATTC 
GACCAGTTCG GGGAAGGCAC CCGCCGATTG GGTCTGGCCA TCGCCGAAAG CCATGCATTT 
TCCATCGCCG GAGGGGGAGA CACACTGGCA GCCATCGACA AATACGGCAT CGCCGACCGC 
ATCTCCTACA TCTCGACGGG GGGCGGCGCC TTCCTGGAAT TTCTCGAAGG CAAGCAACTG 
CCGGCGGTTG CCATGCTGGA GAGCCGCGCG GACTGA

Protein sequence

MAFKRMTDID LAGKRVLIRE DFNVPVKDGR VTSDARIRAA LPTIRHALDA GAAVMLMSHL 
GRPTEGEYAE EFSMKPVADR LSELLGQPVT LVKDYLGGAD PAVGSVVLFE NVRFNKGEKK 
DDEVLARQLA ALCDVYVMDA FGTAHRAEAS THGVGKYAPT ACAGLLLATE LDALGRALHD 
PARPLVAIVG GSKVSTKLTV LDSLSQVVDQ LIVGGGIANT FIKAAGFNVG KSLYEEDLVA 
EARRLMEAAK AKGGEIPVPV DVVVGKRFDA AEPAMVKSVA DIAEDDMILD IGPETSRRYA 
EFIGRAGTVV WNGPVGVFEF DQFGEGTRRL GLAIAESHAF SIAGGGDTLA AIDKYGIADR 
ISYISTGGGA FLEFLEGKQL PAVAMLESRA D