Gene Msil_0689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0689
Symbol
ID	7091920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	751409
End bp	752602
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	61%
IMG OID	643464024
Product	glycosyl transferase group 1
Protein accession	YP_002361022
Protein GI	217976875
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.997173
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCATTT TGCACATCAT TCCGACGTGT AACCCCGAAT ATGGCGGCCC TATCGAAGGC 
ATCTTCACTT CGGCGCCGGC CCTGCGCGCG CAGGGTTGCG ACCGCGAGAT CGTGTCGCTC 
GACATGCCGA CCGATCCATG GGTGAAAACG TCGCCGGTGC GCGTGTACCC CATGGGGAAT 
CCTAGCCCAG CCTATCACGC CTGGAAGAAG CGCATTCCGT TCCTCCGCTA CGGCTATAGT 
CCGGCGATTG TTCCTTGGAT TCGGGAAAAC GCCAAGCGCT ATGACGCGGT CATCGTCAAC 
GGTCTTTGGA ATTTCGCCTC GCTCGCCGCG CGGCAGGCGC TGGTCGGCAC CGATACGCGA 
TATTTCGTTT ACGCGCATGG GATGCTCGAC CCCTATTTCA ACAAGATTTC CCCCGTCAAA 
GCCTTCTTCA AGCAGTTGCT CTGGTGGGCC AGCGAGGGTC GGCTGATCAA CAATGCGACG 
TCCGTCATGT TCGTGACGAA AGAGGAGCGC GAACTGGCCA AGACCTCCTT TTGGCCCTAT 
CGGGCGCGGG CGCGCGTGGT GCCTTATGGA ATCGTCGACG TCAGCGGCGA CGCAGAGGCC 
CAGATCAAGA GCTTTCGCGC CGCCCTTCCG CAGCTCGGCG AGCGCCGTTT TCTGCTGTTC 
CTCAGCCGGA TTCACCCCAA GAAGGGATGC GACATCCTGG TCGAAGCCTT CGCCAAGATG 
GCGGGCGGGG ATCCCGACCT CGATCTGGTG ATCGCCGGTC CGGACTCGGT CGGGGCCGTT 
AAAGAGCTCC AGGAGGTCGC GGCGCAGCGC GGCGTGGCTG ATCGCATCCA CTGGCCCGGC 
ATGCTGAAGG GCGATCTGAA ATGGGGCGCC TTTCGCGCCT GCGATGGATT CATCCTGCCT 
TCGCACCAGG AAAACTTCGG CATTGTCATC GCCGAGGCGC TCGCCTGCGG CAAGCCGGTG 
CTGACCACAG ACAAGGTCGC CACTTGGCGC GAGGTGGCTG ACAATAATGC CGGATTCGTC 
GAAAATGACG ACCTTCCTGG CGTCACCCGG CTGATCGAGC ATTTTTTGAG CCTTTCGCCC 
CTCGAAAAAC AGGAAATGAG CAAACGGGCG CGGGCGACCT ATCTTACGAA GTTCGACATG 
GGCAGCATGG CTCCGGAACT GATCGAGGCT TTCAGGACTT CGCAAGCCGC ATGA

Protein sequence

MIILHIIPTC NPEYGGPIEG IFTSAPALRA QGCDREIVSL DMPTDPWVKT SPVRVYPMGN 
PSPAYHAWKK RIPFLRYGYS PAIVPWIREN AKRYDAVIVN GLWNFASLAA RQALVGTDTR 
YFVYAHGMLD PYFNKISPVK AFFKQLLWWA SEGRLINNAT SVMFVTKEER ELAKTSFWPY 
RARARVVPYG IVDVSGDAEA QIKSFRAALP QLGERRFLLF LSRIHPKKGC DILVEAFAKM 
AGGDPDLDLV IAGPDSVGAV KELQEVAAQR GVADRIHWPG MLKGDLKWGA FRACDGFILP 
SHQENFGIVI AEALACGKPV LTTDKVATWR EVADNNAGFV ENDDLPGVTR LIEHFLSLSP 
LEKQEMSKRA RATYLTKFDM GSMAPELIEA FRTSQAA