Gene Mpe_A2938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2938
Symbol	glyA
ID	4784360
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	3123121
End bp	3124386
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	67%
IMG OID	640091509
Product	serine hydroxymethyltransferase
Protein accession	YP_001022126
Protein GI	124268122
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0112] Glycine/serine hydroxymethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.684623
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAACCG CCACCATGTT CGACCGCCAG CAATCCACCG TCGCGAACGT CGACGCCGAG 
CTTTGGGCCG CCATCCAGGC AGAGAACCGC CGCCAGGAAG AACACATCGA GCTCATCGCG 
TCCGAGAACT ACGCCAGCCC GGCCGTGATG GCGGCGCAGG GCACCCAGCT GACCAACAAG 
TACGCCGAAG GCTACCCCGG CAAGCGCTAC TACGGCGGCT GCGAGAACGT CGACGTGGTG 
GAGCAACTGG CCATCGACCG GCTCAAGCAG CTGTACGGTG CGGCCTTCGC CAACGTGCAG 
CCCAACTCCG GCTCACAGGC CAACCAGGGC GCGTTCTTCG CGCTGCTGCA GCCTGGCGAC 
ACCATCATGG GCATGAGCCT CGCCGAGGGC GGCCACCTGA CGCACGGCAT GGCGCTCAAC 
ATGAGCGGCA AGTGGTTCAA GGTGGTCAGC TACGGCCTCG ACGCCAAGGA AGAGATCGAC 
TACGACGCGA TGGAACGGCT GGCCCACGAG CACAAGCCCA AGCTCATCAT CGCCGGGGCG 
TCGGCCTATG CGCTGCGCAT CGACTTCGAG CGCTTCGCCA AGGTAGCCAA GGCCGTGGGG 
GCCTACTTCA TGGTCGACAT GGCGCACTAC GCCGGCTTGA TCGCCGCGGG CGTCTACCCG 
AACCCGGTGC CGTTCGCCGA CGTGGTGACC TCCACCACGC ACAAGAGCCT GCGCGGGCCG 
CGCGGCGGGA TCATCCTGGC GAACAACGAG GACATCGCGA AGAAGATCAA CAGCGCGATC 
TTCCCCGGCC TGCAGGGTGG CCCGCTGATG CACGTGATCG CGGCCAAGGC GGTGGCGTTC 
AAGGAGGCGC TGCAGCCCGA ATTCAAGGCC TACCAGCAAC AGGTGGTGAA GAACGCCGAC 
GCCCTGGCGC GCACGCTGAC CGAGCGCGGC CTGCGCATCG TGTCGGGCCG CACCGAGAGC 
CACGTGATGC TGGTCGACCT GCGTCCCAAG GGCCTGACCG GCAAGGAAGC GGAGGCCATC 
CTCGGCCAGG CGCACATGAC CTGCAACAAG AACGGCATCC CGAACGATCC GCAGAAGCCG 
ATGGTCACCA GCGGCATCCG CCTGGGCAGC CCGGCGATGA CGACGCGCGG TTTCGGAGTG 
GAACAGGCGG TCCGGACCGC GCACCTGATC GCCGACGTGC TCGACCGACC GCACGACGAG 
AGCAACCTGG CCGACGTGCG CGCCAAGGTG GCGCTGCTGA CGCGCGAGTT CCCGGTCTAC 
CGTTGA

Protein sequence

MRTATMFDRQ QSTVANVDAE LWAAIQAENR RQEEHIELIA SENYASPAVM AAQGTQLTNK 
YAEGYPGKRY YGGCENVDVV EQLAIDRLKQ LYGAAFANVQ PNSGSQANQG AFFALLQPGD 
TIMGMSLAEG GHLTHGMALN MSGKWFKVVS YGLDAKEEID YDAMERLAHE HKPKLIIAGA 
SAYALRIDFE RFAKVAKAVG AYFMVDMAHY AGLIAAGVYP NPVPFADVVT STTHKSLRGP 
RGGIILANNE DIAKKINSAI FPGLQGGPLM HVIAAKAVAF KEALQPEFKA YQQQVVKNAD 
ALARTLTERG LRIVSGRTES HVMLVDLRPK GLTGKEAEAI LGQAHMTCNK NGIPNDPQKP 
MVTSGIRLGS PAMTTRGFGV EQAVRTAHLI ADVLDRPHDE SNLADVRAKV ALLTREFPVY 
R