Gene Mpal_2019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_2019
Symbol
ID	7272000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	2140968
End bp	2142119
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	64%
IMG OID	643570633
Product	proposed homoserine kinase
Protein accession	YP_002467043
Protein GI	219852611
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3635] Predicted phosphoglycerate mutase, AP superfamily
TIGRFAM ID	[TIGR00306] 2,3-bisphosphoglycerate-independent phosphoglycerate mutase, archaeal form [TIGR02535] proposed homoserine kinase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.734369
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.229701
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGTACC TGCTCGTCCT CGGAGACGGA ATGGCCGACG AACCGATCCC GGAGCTGGGT 
AACCGGACGC CGCTCGCCTA TGCGAACACC CCGAACATGG ATCGGATCGC ACGCGAGGGG 
AGGTCCGGGC AGGTGCAGAC GGTCCCGGAC GGTTTTGAAC CCGGCAGCGA TGTCGCCAAC 
CTCTCGATCC TCGGCTATCA TCCGGCCCGG TTCTATACCG GCCGGGGTCC ACTCGAGGCC 
GTGAACATGG GGGTCGACCT GACCGACGAC CAGATCGCCT ACCGCTGCAA CCTGGTCACG 
ATCAGAGACG GGGTGATGCA GGACTTCAGC GCCGGGCATA TCACCTCAGC CGAGGGGGCG 
GCCCTGTTCA AATCCCTGCA GGAGTACCTG CCGGAGGTGA AGCTCGTCTC AGGGGTCAGT 
TACCGGAATC TGCTGGTCGT CGACAGGGGG AGGGGGGCCG AGGGAAAGGC ACCCCACGAC 
ATCGTCGGCG AGGAGATCGA GCAGTACCTG CCGCACGGTG AGGATGCACC ACTGCTTCGG 
GCCTGCATCG AGAAGAGCAT CGAGGTCTTC GCCGATCACC CGGTGAACCG GGACCGCCTG 
GCCAGGGGAT TGCCGGCTGC GACGATGATC TGGCCGTGGA GCGGTGGCAA GCGCCCGGCT 
CTGATCCCAT TTCAGGAGAA GTACGGAAAG AAGGGCGGGA TGATCTCGGC GGTCGACCTG 
CTGAACGGGA TCGCCCGGTA CGCGGATATG AAGGTGATCA CCGTCCCCGG GGCGACCGGT 
TACCTGGACA CCGACTACCA GGCCAAGGCC CGGTATGCCA TCGAGGCGCT CAAAGACCTC 
GACTTTCTGT ACCTGCATGT CGAGGCCCCG GACGAGGCCG GGCATCTCGG CTCGCTCAAG 
GAGAAGGTGA AGGCGATCGA ACGGGTCGAC GAGATGATCG GCACCATCAT GGCCGGCTTC 
GACGGCGTGA TTGCCGTGCT CCCCGACCAT GCCACCCCAA TCCGGCTGAA GACCCATACG 
CGAGGTCCGG TCCCCTGTGC AGTGCTCGGA AAGGGAAAGG ATGAGACAGA AGTATTCTCA 
GAAGAAGCGG CGGCGAACGG GTCGCTCGGG ATGATCCGGG GGGATCTGTT CCTGACGGAA 
CTCTTCTCCT GA

Protein sequence

MKYLLVLGDG MADEPIPELG NRTPLAYANT PNMDRIAREG RSGQVQTVPD GFEPGSDVAN 
LSILGYHPAR FYTGRGPLEA VNMGVDLTDD QIAYRCNLVT IRDGVMQDFS AGHITSAEGA 
ALFKSLQEYL PEVKLVSGVS YRNLLVVDRG RGAEGKAPHD IVGEEIEQYL PHGEDAPLLR 
ACIEKSIEVF ADHPVNRDRL ARGLPAATMI WPWSGGKRPA LIPFQEKYGK KGGMISAVDL 
LNGIARYADM KVITVPGATG YLDTDYQAKA RYAIEALKDL DFLYLHVEAP DEAGHLGSLK 
EKVKAIERVD EMIGTIMAGF DGVIAVLPDH ATPIRLKTHT RGPVPCAVLG KGKDETEVFS 
EEAAANGSLG MIRGDLFLTE LFS