Gene Mext_2087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_2087
Symbol
ID	5831808
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	2329011
End bp	2330150
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	69%
IMG OID	641367885
Product	HPP family protein?
Protein accession	YP_001639554
Protein GI	163851511
COG category	[T] Signal transduction mechanisms
COG ID	[COG3448] CBS-domain-containing membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.211615
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.139739
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAATC CCGGTGGCCC GGAACAACGC GCTGAACGAT CGCAAGGATT CCGCCTGTTC 
AGACCGATTC TGGCCGGCGC GACCCTGCGT GAGCGCCTGA TCGCGTGCCT GGGTGCTCTT 
GCGGGCATCA CGCTCACCGG CCTGGTCTGC GGCTGGTTCT TCGGAGAAGG CCCCCATATC 
CCGCTGATCG TCGCGCCGAT GGGGGCGTCG GCGGTGCTGA TCTTCGCCGT GCCGGCCAGT 
CCGCTCGCCC AGCCCTGGTC GGTCATCGGC GGCAACACCA TCTCCGCGTT CATGGGCGTG 
CTCGCTGCGC ACCTCATTCC CGATCCTGTC ATTGCGATCG GCGTCGGCGT CTCCCTTGCG 
ATCGCGGCGA TGTCGCTGAC CCGGTGTCTT CACCCGCCGG GCGGGGCCGC CGCCTTGACC 
GCACTCATCG GCGGCCCGGC CGTCACGTCG GCGGGCTTCC TGTTCCCGCT TTTCCCGGTC 
GGCCTGAACT CGGTCATTCT CGTTGCGCTC GGCATCGGCT TCCACAAGCT CTCGCGCCGC 
AACTACCCGC ACGTCGCGGT CGCGACGCCG GTGAACACCC ATGGGACGGG GGATTTGCCG 
GCCCCGCTCC GGGTCGGCTT CCGGCCTGAA GATGTCGATG CGGCCCTGGT CGCGCTCGAC 
GAGACGCTGG ACATCGACCG CGCCGATCTC GACCGGCTTC TCCGGCAGGT CGAACTCCAC 
GCACTCGTGC GCGCACGGGG GGATCTGACC TGCGGTGAGG TGATGTCACG CGACGTCGTC 
ACCATCGGGC TCGATGGCAG CGCCGAACGG GCACGGGAGC TTCTGCTCGC CCACAACATC 
AGGACGCTTC CCGTCATCGA CCGGGCCGGC CGGCTCGCCG GAACGATCGG CCTGCGCGAG 
CTGACTCTGC ACGGCGAGGT GGCGCTGGCG CAGGTGATGT CCGAGGCCAG GACGACCGGG 
CCGGACGACC CGGTGATCGC GCTGGTGAAC GATCTGACGG ACGGTCACAC CCATGCGGTC 
GTCGTCATCG CCGACGACCG GCGCGTGCTG GGGATCATCA CCCAGACCGA TCTGCTCGCG 
ACCCTGACGC GCCTGCTCTC CGCCAAGGCG TTCGCGCTGC CCGATCCGGT CTCACCCTAG

Protein sequence

MPNPGGPEQR AERSQGFRLF RPILAGATLR ERLIACLGAL AGITLTGLVC GWFFGEGPHI 
PLIVAPMGAS AVLIFAVPAS PLAQPWSVIG GNTISAFMGV LAAHLIPDPV IAIGVGVSLA 
IAAMSLTRCL HPPGGAAALT ALIGGPAVTS AGFLFPLFPV GLNSVILVAL GIGFHKLSRR 
NYPHVAVATP VNTHGTGDLP APLRVGFRPE DVDAALVALD ETLDIDRADL DRLLRQVELH 
ALVRARGDLT CGEVMSRDVV TIGLDGSAER ARELLLAHNI RTLPVIDRAG RLAGTIGLRE 
LTLHGEVALA QVMSEARTTG PDDPVIALVN DLTDGHTHAV VVIADDRRVL GIITQTDLLA 
TLTRLLSAKA FALPDPVSP