Gene Mext_4043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4043
Symbol	engA
ID	5834513
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	4499007
End bp	4500347
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	71%
IMG OID	641369834
Product	GTP-binding protein EngA
Protein accession	YP_001641484
Protein GI	163853441
COG category	[R] General function prediction only
COG ID	[COG1160] Predicted GTPases
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR03594] ribosome-associated GTPase EngA

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0947633
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.421854
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCTGC CGACCGTCGC GATCGTCGGA CGCCCGAATG TCGGCAAGTC GACCCTGTTC 
AACCGGCTGG TCGGGCGCAA GCTCGCCCTG GTGGATGACC GCCCCGGCGT GACCCGCGAC 
CGCCGCGAGG GCGAGGGCTT CATCGGCGAC GTCGCCTTCC GCGTCATCGA CACCGCGGGC 
CTCGAAGAGG CGGACGCCGA CTCGCTGCTC GGCCGCATGC GCGCCCAGAC CGAGGCCGCC 
ATTCTCGAAG CCGACGCGGT GCTGTTCGTC ATCGACGCCC GCGCCGGCGT CCTGCCGTCC 
GACCGGCCCT TTGCCGAGCT GGTGCGCCGC TCCGGCTGCC CCGTCATCCT CATCGCCAAC 
AAGGCCGAGG GCGGCGCCGG CATGGCCGGC GCCTACGACG CGTTCTCGCT GGGGCTCGGC 
GATCCGATCC CGTTCTCGGC CGAGCACGGC GAGGGCCTGG GCTCGCTGCA GGATGCCCTG 
CGCGAGGTTC TGCCCGAACC CGACGAGGAG GACGAGGACG GGGAGGGCGG CAAGGGCCTG 
CGCGTCGCCA TCGTCGGGCG CCCGAACGCC GGCAAGTCCA CCCTGATCAA CCGGATGATT 
GGCGAGGATC GCCTGCTGGT CGGCCCCGAG GCCGGCATTA CCCGCGATTC GATCTCCCTC 
GATTGGGAGT GGCGCGGGCG CCGGATCAAG CTGCACGACA CCGCCGGCAT GCGCCGCCGG 
GCGCGCATCG ACGACAAGCT CGAAAAGCTC GCGGTCTCGG ACGGCTTGCG CGCCGTGCGC 
TTCGCCGAGG TCGTGGTCGT GCTCCTCGAT GCGACGATCC CGTTCGAGAA GCAGGATCTC 
ACCATCGTCG ATCTCGTCGA GAGCGAGGGC CGCGCGGTGG TGATCGGCCT CAACAAGTGG 
GATCTCGTGG CCGACCAGCC GGGCCTGCTC AAGACCCTCC GGGAAGACTG CACCCGCCTG 
CTGCCGCAGG TGCGCGGCGT CTCGGTGGTG TCGCTCTCGG GGCTCGCCGG CGACGGCATC 
GACAAGCTGA TGCAGGCCGT GGTCGATGCC TCCGAGGTGT GGAGCCGGCG CGTCTCGACG 
GCGCGGATCA ATGCGTGGCT CACCGACGCG CTCCAGCGCA ACCCGCCGCC CGCGGTCTCC 
GGCCGGCGCA TCAAGATCCG CTACGCGACC CAGGTGAAGA GCCGCCCGCC GCACTTCGCC 
CTGTTCGGCA ACCAGCTCGA CGCCCTGCCG AAATCCTACA CCCGCTACCT CGTCAACGGC 
CTGCGCGAGG CCTTCGATCT GCCCGGCACG CCGATCCGGC TGTCCCTGCG CACCACGAAG 
AACCCGTTCG AGAAGGGCTA A

Protein sequence

MDLPTVAIVG RPNVGKSTLF NRLVGRKLAL VDDRPGVTRD RREGEGFIGD VAFRVIDTAG 
LEEADADSLL GRMRAQTEAA ILEADAVLFV IDARAGVLPS DRPFAELVRR SGCPVILIAN 
KAEGGAGMAG AYDAFSLGLG DPIPFSAEHG EGLGSLQDAL REVLPEPDEE DEDGEGGKGL 
RVAIVGRPNA GKSTLINRMI GEDRLLVGPE AGITRDSISL DWEWRGRRIK LHDTAGMRRR 
ARIDDKLEKL AVSDGLRAVR FAEVVVVLLD ATIPFEKQDL TIVDLVESEG RAVVIGLNKW 
DLVADQPGLL KTLREDCTRL LPQVRGVSVV SLSGLAGDGI DKLMQAVVDA SEVWSRRVST 
ARINAWLTDA LQRNPPPAVS GRRIKIRYAT QVKSRPPHFA LFGNQLDALP KSYTRYLVNG 
LREAFDLPGT PIRLSLRTTK NPFEKG