Gene Mext_1133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1133
Symbol
ID	5834408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	1238255
End bp	1240273
Gene Length	2019 bp
Protein Length	672 aa
Translation table	11
GC content	64%
IMG OID	641366928
Product	cellulose synthase (UDP-forming)
Protein accession	YP_001638608
Protein GI	163850565
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0362124
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.973174
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTCAGC ATCTCCTAGA GCTCAACCTC GCCCCACTCG CGCCGACCTG CCTCGTCGGG 
GCTTTCTTTT ATCTTTTCGT GACGAACTGG CCGCGGCAGA AGACCTGGGC GCGGAGCATC 
GCCTGCGCCT TCGTTCTCGC GGTGGCCGTG CGCTACCTCC TCTGGCGCTT CTTTCACACG 
GTGCTGCCGC ATCCTGTGGA CGGCAGCTTC GCCCTCATCT GGACCTGGGC CGTCTTCTTC 
GTGGAACTCG GCGCCTTCGC CGACATCCTG CTCTTCCTTG TGGTGATGAG CCGCTCGGTC 
GACCGAAGCG CCGAGGCCAG CCGGTTGGAG CGAGCCTTCT TCGCACGCCC GGAGGCGGAG 
TTGCCGACCG TCGATGTCTT CATCCCAACC TACAACGAGC CGCTCGACGT GCTGGAGCGG 
ACCATCGTCG GGGCTCTCGC GCTCGATTAC CCGCGGGACA AGTTCAAGGT CTATGTCCTC 
GACGACAAGA AGCGCGACTG GTTGAAGGCG TATTGTGAGG AGAAGGGCGC GATCCACGTC 
ACCCGGCCGG ACAATTCCCA CGCCAAGGCC GGCAACATGA ACAACGGCCT CAAGGTCTCC 
TCAGGCGACT TCATTGCGAT CTTCGACGCC GATTTCGTGC CCTACCGCAG TTTTCTGCGC 
CGCACGCTGC CCTTCTTCAC GGACCCGACG ATTGGCATCG TTCAGACCCC GCAACATTTC 
TTCAACAAGG ATCCGGTCCA GTCGAACCTC TCGCTCGAAA AGGTCTGGCC CGACGAGCAG 
AGATTGTTCT TCGATGAGAT GGCCGCGAGC CGCGATGCCT GGGACGTGAG CTTCTGCTGC 
GGTTCCTGCT CGATCGCCCG CCGCGCGGCC CTCGATGTAA TCGGCGGCTT CCCGCACGAC 
TCGATCACCG AGGATCTCCT CACGACCCTC GCGATGCTCA ACAAGGGATA CAAGACCCGC 
TACCTGAACG AGCGTCTGTC GATGGGTCTC GCGGCGGAGA ACCTGAAGGG ATACTTCGTT 
CAGCGGGGCC GCTGGTGCCG CGGCGGCATC CAGACGATCT ACCTGCATAA CGGCCCGCTG 
CGGGGGGCGG GCTTGAACCT GTTCCAGCGG GTGATGTTCC TGCCCCTGTC GTGGCTGATG 
CAGTACACGA CGCGGTTCGT GATCCTCGTG GTACCGGCCG TCTACCTCTG GACCGGCGCA 
GCACCGCTGT ACTTCACCGG CTCGCAGGAC ATCGTCTATT ACCAGTTGCC CGTGCTCACG 
GCCTACTTCC TGCTGATGGG CTGGTTGACG CCGACCCGCT ACTTGCCACT GGTGTCGAGC 
GCGGTGGGCA CCTTCGCGAC GTTCCGCATG CTGCCCGTTG TGGTCTCCAG CGTGATCAAG 
CCGTTCGGCG TGCCGTTTCG CGTGACGCCG AAGGGCAGCG GCAACGAGGA GAACGCCTTC 
GACGCCTACA CCTTCTTCTC GATCGCCTTC TGGATCGCCG TCACCGCGCT CGGCCTCGTC 
ATCAACATCG TGCCGGAATG GTCGCGCATC GGCGAGGGTG AGTTCTCGCT CGTCTCGGCC 
TACTGGGCCG CCCTCAACAT CCTCGTCCTC TTGGTCGCGG CCCTGATCTG CTTCGAGAAA 
TCGCGTCCGC TCCTTGACAG TTTCGCAACA GACGAGCCGG CCCGCATCGT CGCAGCGGAC 
CGCGCCTTGG ACGCGCGGAT CGTCAATCTG TCGCTCGATC GAGGGATCGC ATCCTTCCCG 
GCCGATCCCG AGCTATGCCC CGGCGACCAG ATCTGGATCG AGATGGAGCG CTTCCCGCAC 
CTTGAAGCCA CGGTCGAAGG CGTGACGCCG GGCAGGCGTC GGAGCCCCGC TTGCGTCCGA 
TTTTCCTACA ATCTCGAGGG CGCCTGCCGC GACGTGATGA TTGTCCGCCT CTACACCGGC 
CAGTACTCGC AGGACATCCG TGACATCGAC AAGTCGGCCG TCGTCGGGGG CCTCTGGAGC 
CGCCTGTTCG GACGAGGTAG CACCTATGGC CCGGCTTGA

Protein sequence

MVQHLLELNL APLAPTCLVG AFFYLFVTNW PRQKTWARSI ACAFVLAVAV RYLLWRFFHT 
VLPHPVDGSF ALIWTWAVFF VELGAFADIL LFLVVMSRSV DRSAEASRLE RAFFARPEAE 
LPTVDVFIPT YNEPLDVLER TIVGALALDY PRDKFKVYVL DDKKRDWLKA YCEEKGAIHV 
TRPDNSHAKA GNMNNGLKVS SGDFIAIFDA DFVPYRSFLR RTLPFFTDPT IGIVQTPQHF 
FNKDPVQSNL SLEKVWPDEQ RLFFDEMAAS RDAWDVSFCC GSCSIARRAA LDVIGGFPHD 
SITEDLLTTL AMLNKGYKTR YLNERLSMGL AAENLKGYFV QRGRWCRGGI QTIYLHNGPL 
RGAGLNLFQR VMFLPLSWLM QYTTRFVILV VPAVYLWTGA APLYFTGSQD IVYYQLPVLT 
AYFLLMGWLT PTRYLPLVSS AVGTFATFRM LPVVVSSVIK PFGVPFRVTP KGSGNEENAF 
DAYTFFSIAF WIAVTALGLV INIVPEWSRI GEGEFSLVSA YWAALNILVL LVAALICFEK 
SRPLLDSFAT DEPARIVAAD RALDARIVNL SLDRGIASFP ADPELCPGDQ IWIEMERFPH 
LEATVEGVTP GRRRSPACVR FSYNLEGACR DVMIVRLYTG QYSQDIRDID KSAVVGGLWS 
RLFGRGSTYG PA