Gene Mext_2134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_2134
Symbol
ID	5831240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	2392773
End bp	2393714
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	70%
IMG OID	641367932
Product	diguanylate cyclase
Protein accession	YP_001639600
Protein GI	163851557
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain [COG2202] FOG: PAS/PAC domain
TIGRFAM ID	[TIGR00229] PAS domain S-box [TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.298927
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACACCT TTCCTCAGAA CGGGCTTGGC GCGATGCCTT CCGATACGGG CGCGGCGAAT 
GACGACTCGT CCGCGGCGAT GCGCCGGGAA TTGGCCCGCC TGCGGGAGAT GCTGGAGCAG 
AACTCGGACT GGATCTGGGA GGTCGATGCG CAGGGGCGCT ACACCTACGC CTCGCGCCAA 
TGCGTCGCCC TGCTCGGTCG CGAGCCGGAG GAGGTGCTGG GTCGCACCCC CTTCGACTTC 
ATGCCGCCGG ACGAGGCCGA GCGTGTCGGC CGGATCTTCG GCGCCATCGC CGCCGAGCAA 
CGACCCTTCA CCCAGCTTCT CAACCGCAAC CTGCGCAAGG ATGGCAGCCT CGTCGTCCTG 
GAAACGAGCG GCGTGCCGCT GCTCGGTCCC GACGGAGCGT TGCGCGGCTA TCGCGGCATC 
GACCGGGATG TGACGCAGCG AGAGGCGGCG AACGAGCGGC TCCGCCACCT CGCCCGACAC 
GACGACCTCA CGGGCCTGCC GAACCGGATG TATCTGCGTG AGCATCTTGC GGGGCAATTG 
GCCGCCGGAC AACGCCCCGG CGTGCTCTGC CTCGATCTCG ACGGCTTCAA GCCCGTCAAC 
GATCGCCTCG GCCACGCCGC GGGCGATCGC GTCCTGACGG AGATCGGTCG CCGCTTGGCC 
GAACTGGCGG CTTCGCACGG CCTGTTCGCG GCGCGGCCCG GCGGCGATGA ATTCGTCCTG 
ATCCTGCCCG ACGGCGTGGC GGTGTCGCCC GAGGCCGTTC GCGCGGTCAT CGCTACACCC 
ATCGCCGTCG ATGCCGAGCC AGTGCGGATC GGCGCCAGCC TCGGCCTCGC TTCGGCACAG 
GGCCCCGAGG ACACGGTCGA TGCCCTGCTC GCGCGGGCCG ACCGTGTCCT CTACGACGCC 
AAGGAAGCCG TCAGACGGGT CGGCGTCAGC GACGGCGGCT GA

Protein sequence

MNTFPQNGLG AMPSDTGAAN DDSSAAMRRE LARLREMLEQ NSDWIWEVDA QGRYTYASRQ 
CVALLGREPE EVLGRTPFDF MPPDEAERVG RIFGAIAAEQ RPFTQLLNRN LRKDGSLVVL 
ETSGVPLLGP DGALRGYRGI DRDVTQREAA NERLRHLARH DDLTGLPNRM YLREHLAGQL 
AAGQRPGVLC LDLDGFKPVN DRLGHAAGDR VLTEIGRRLA ELAASHGLFA ARPGGDEFVL 
ILPDGVAVSP EAVRAVIATP IAVDAEPVRI GASLGLASAQ GPEDTVDALL ARADRVLYDA 
KEAVRRVGVS DGG