Gene Msil_0984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0984
Symbol
ID	7093663
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	1065740
End bp	1066951
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	60%
IMG OID	643464323
Product	glycosyl transferase group 1
Protein accession	YP_002361315
Protein GI	217977168
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.0137415
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGACA AGCCTGCGGA GTGTTTGACC ATCGGCGCGA ACGCAATCCA TTCCCATTTG 
GCATTTACGA AGATGCGCAC CGTCGCTTGC GCTCTCCAGA CCTATTCCAA GGTTGGAGGA 
CTGCAAAGCT TCAATCGCAG GTTGTTTCAA AATTTGGGCC GCCGCGCCCT CGACGCCGGC 
GAGCTCCCTG TGCGCGCCTT TGTCGATGAT GACGCCGATG TGGCACTCCC CACGCTTCCC 
GGCGTCGAAT TGGTCGCGCC GAAATCAAGG CTTGCATTTT TCGCTGGAGC TTTCTGGAGC 
GGCGTATTCG AAGCCGATGC GCTTCTGGTC TGCCATATCA ACTTGTTGCC GCTGGCGATC 
GCCGTTCGGC TGTTTCGTCC CCGTCTGCCG ATCGTGTTGT TTGTGCATGG TTTTGAAGCC 
TGGAACAGCC AAAATCGGCC GCGCAAGCTG AGCGAACATC TATTCCTGAA AGCCGTGACC 
CGAATCGTTT CCGTGAGCCG CTATACCGCC GCCGTAATGA GCCGCGAATT CGGCGTCCCG 
CTCGAAAAAT TCCGCATCCT GCCGAATGCG GTCGATCATA TCGGGCTCGA GGTTCCGGCC 
CCGGCGCGAC GGCCTTTCTC GATCTTGACC GTGACGCGCC TCAGCGCTGG GGAACGCGCC 
AAGAACGTCC ATGAAATGAT CGCCGCCGTC GCCGCCTTGC GGAAGGTCCT GCCGGACGTG 
TCCTATGAGA TCATCGGCGA AGGCGCGCTG CGTCCAGAGC TTGAAGCGCT CACGCGCGAG 
CTTGGCGTCG ACGATGTGGT TTCCTTCCGC GGGCTTGTCG ACGTCGAAAC CCTGCAGGCG 
GCCTATGCTT CGGCCTGCGT CTTCGCCATG CCGTCGGACA AGGAGGGGTT TGGCATCGTC 
TATCTTGAGG CCTGGCAATA TGGCTTGCCG GTCATCTGCA GCATCCACGG CGCCGCGAGC 
GAAGTCGTCA CGGACGGCGT CGAAGGTTTC GTGGTCGACC CGGCCGATAT TTCCACGCTG 
ACGGCGCGGC TTCATGATTT GCTGTCGAAG CCGGATTTCG CGCGGGAGAT GGGCGAGCGT 
GGGCGCCAGA AGGTCGAGGC AAAATATCTC AACGCCAATT TCCGCGTCGA TCTTTCCGTT 
ATTCTCGACG AACTCGACGA CCCTGAAGGC GAGGGCGCGG TCGCCCGCCG CCATTCGCAG 
CTCAAATTCT GA

Protein sequence

MFDKPAECLT IGANAIHSHL AFTKMRTVAC ALQTYSKVGG LQSFNRRLFQ NLGRRALDAG 
ELPVRAFVDD DADVALPTLP GVELVAPKSR LAFFAGAFWS GVFEADALLV CHINLLPLAI 
AVRLFRPRLP IVLFVHGFEA WNSQNRPRKL SEHLFLKAVT RIVSVSRYTA AVMSREFGVP 
LEKFRILPNA VDHIGLEVPA PARRPFSILT VTRLSAGERA KNVHEMIAAV AALRKVLPDV 
SYEIIGEGAL RPELEALTRE LGVDDVVSFR GLVDVETLQA AYASACVFAM PSDKEGFGIV 
YLEAWQYGLP VICSIHGAAS EVVTDGVEGF VVDPADISTL TARLHDLLSK PDFAREMGER 
GRQKVEAKYL NANFRVDLSV ILDELDDPEG EGAVARRHSQ LKF