Gene Msil_3537 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3537
Symbol
ID	7092394
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	3885444
End bp	3886910
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	60%
IMG OID	643466828
Product	exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase
Protein accession	YP_002363788
Protein GI	217979641
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2148] Sugar transferases involved in lipopolysaccharide synthesis
TIGRFAM ID	[TIGR03023] Undecaprenyl-phosphate glucose phosphotransferase [TIGR03025] exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.0569176
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACTTTA ATCGCTTAAG CCAGATTGCT GAATCCGAGA TTGACGGGGA CGTGGTAGCC 
GCTTCCTCTG CAAAACTTTA TGTATCCTAT AAAAACATTG AGGTGATCGC GGGCTGCGTC 
GATATATTCT TGATTACCCT GTCCAGCGTA TTGGGCGTCC TTTTCTATCA GTATATTTGG 
TCGGGCGAGA GCGCCCCTAT CGAAATAAGC CTCGGCGTCG GGCTGTCTCA GGCGTTGCTC 
TATACCTATG TCGCCAGCTC CCGCGGTCTT TACCGCCTGC CGGTTTTACT TGCGCCCTCG 
CGATATTTAG GCCGCATCTT CATGACCTGG GCGGTCGTCG TGCTGTTTGT GGCGATCTTT 
CTGGTTTTCC TGCGCGGCGA GACCGTGCTG CCGCGCGGAG CCATGACGGC CGCCGCCGTC 
ATGCAGATTT CTCTGCTTCT CGTCGCGCGC TGGCTCGCCG AGAAGACGTC GCGGTCGCTG 
ATGGCCAGGG GCGGCCTCGC CGGCCGCCGG GTCGTCACGC TCGGCGAGCC CTCCGAACTG 
CTGCGGCTCT CGACGGCTGT CCTGTTCCGT TATTTCGGCC TCACCGAAGT CGCCCGCGTC 
TCATTGGCGA GCGGAAGCGG GGCATCCGCG GAGGATGTGC TGGTGGATCT CGACCGCGCC 
TTGCACGAGG CTCGTGAATC TCACGCCGAT CAATTCGTGG TGGCTCTGCG CTGGAACAAC 
GCCGCGCTGC TCGAAACGGT GCGGGAAAGA TTGCGCGCGT CGCCGCTGCC CGTGGAGCTT 
CTTCCCGATT ATACGATTCG TTCGGTTCTG GGACGCCGCC TGCTGTCGAC CAGCGGGCCT 
GGCCTGACGC TCGAAATCCA GCGGGCGCCG CTGACCCGCG TCGAGCAGAC GATCAAGCGC 
ACGCTCGACA TCGTCTGCTC CTCAATCGGC ATTGTGCTCC TATCGCCGCT GTTCGTCATG 
ATCGCCGTTT TGATCAAGCT CGACAGCAAA GGTCCCGTCA TCTTCAAGCA ACGCCGCAAC 
GGCTTCAACG CCCGGCAGTT CCAGATTTAC AAATTCCGTT CGATGACGGT GCAGGAAGAC 
GGCGACAAGA TTGTGCAGGC GAGACGCAAC GACCGCCGCG TGACGCGCGT GGGTCAGTTT 
CTGCGCCAGT CCAGCATGGA TGAGCTGCCG CAGCTGTTCA ATGTGTTGAA GGGCGATATG 
TCGCTGGTGG GCCCGCGCCC GCACGCCCTC GCGCATGACA ATGAATATAA GGTGCTGATC 
GCGAAATATG CGTTCCGCCA TCACGTCAAG CCGGGGATCA CCGGCTGGGC GCAATGCAAT 
GGCCTGCGCG GGGAAACCGG CCAGCTCGAG CAGATGATCG AGCGCGTCAA ACTCGACCTC 
TGGTACGTCA ACCATTGGTC GATCGCGCTC GACATCAACA TCCTGCTGCG CACCTGCTTT 
GAAGTGCTGC GCAACCGCGC CTATTGA

Protein sequence

MYFNRLSQIA ESEIDGDVVA ASSAKLYVSY KNIEVIAGCV DIFLITLSSV LGVLFYQYIW 
SGESAPIEIS LGVGLSQALL YTYVASSRGL YRLPVLLAPS RYLGRIFMTW AVVVLFVAIF 
LVFLRGETVL PRGAMTAAAV MQISLLLVAR WLAEKTSRSL MARGGLAGRR VVTLGEPSEL 
LRLSTAVLFR YFGLTEVARV SLASGSGASA EDVLVDLDRA LHEARESHAD QFVVALRWNN 
AALLETVRER LRASPLPVEL LPDYTIRSVL GRRLLSTSGP GLTLEIQRAP LTRVEQTIKR 
TLDIVCSSIG IVLLSPLFVM IAVLIKLDSK GPVIFKQRRN GFNARQFQIY KFRSMTVQED 
GDKIVQARRN DRRVTRVGQF LRQSSMDELP QLFNVLKGDM SLVGPRPHAL AHDNEYKVLI 
AKYAFRHHVK PGITGWAQCN GLRGETGQLE QMIERVKLDL WYVNHWSIAL DINILLRTCF 
EVLRNRAY