Gene Msil_1996 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1996
Symbol
ID	7094194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	2166473
End bp	2167618
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	66%
IMG OID	643465322
Product	glycosyl transferase group 1
Protein accession	YP_002362300
Protein GI	217978153
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGATCG CCATTCTCGC CCATTCCACC AATCCGCGCG GCGGCGTCGT CCATGCGCTG 
GCGCTCGGCG ATGCGCTGAC GCGGCTTGGC CATGGGGCGG TCGTCCACGC GCCGGACGCG 
GCGGGCGCGG GCTTCTTCCG CAAGACGCTG TGCGACACGA TTCTGGTTCC GGCGACGCCT 
TCCGGCCCCG GAGTGACCGG ATTGGTCGAA CGCCGCGTCG CCGATTATGT CCGCCATTTC 
GAGGCGCCGG CGCATCGCCG CTTCGACGTC TACCATGCGC AGGACGGAAT TTCCGGCAAT 
GCGCTCGCGA CGCTGAAGCA GCGCGGGCTG ATCCGCGATT TCATCCGGAC TGTTCACCAC 
ATTGATGATT TCGCCGACCC GAGATTGCGC GCCCTACAGA AGCGCTCCAT CACACAGGCA 
GGGCGCCATC TCGTCGTCAG CCACGCCTGG CGCAACGCGC TTGCCCATGA CTTCGGGGTT 
GAGGCGGCGA TCGTCGGCAA TGGCGTCGAC AGGCGCTGCT TTTCGCCAGC TCGAGACGGG 
AGCGAATCCG CGCTGCGCGA AAACCTCGGC CTTGGCGCGG GGCCGGTTTT TCTCTCCATC 
GGCGGCGTCG AGGCGCGCAA GAATTCGCTA TGCATGCTCA GGGCCTTTGC CCGCCTCCAG 
AGGCGGCTGC CTTCGGCGCA GCTCGTCATC GCCGGCGGCG CCTCGCTGCT CGACCATGAC 
GCCTATCAGC GGCAATTTTC TGACGCGCTG ACGGAGCTTC GCCTGCCGCC CGGCGCCGTG 
ATCCGCACCG GGCCGCTGGC GCAGGCCGTC ATGCCGGCGC TCTACAGGCT GGCGGATGGG 
TTGGTGTTTG CCTCGCTCAA AGAGGGCTTC GGTCTGGCAG TGCTGGAAGC CATGGCGTGT 
GGCGTTCCGG TCATCGTCTC CGAGATCGCG CCCTTCACCG AATATCTTGG GCCTGACGAC 
GCCGCCTGGT GCGATCCGCT CGATGTTGAC TCCATCGCGC GCGCTATGAC GGCGGCATTG 
CGCCCTCAGC TTCGCGCTCA ACTCATAGAG AATGGATTCG CTGCGGCCGC GCGGCATGAT 
TGGGACGCGA CGGCGCAAGC GCATCTTGCC AGCTATGAAA GCCTGAAGGA AACCGCCGAT 
GCCTGA

Protein sequence

MRIAILAHST NPRGGVVHAL ALGDALTRLG HGAVVHAPDA AGAGFFRKTL CDTILVPATP 
SGPGVTGLVE RRVADYVRHF EAPAHRRFDV YHAQDGISGN ALATLKQRGL IRDFIRTVHH 
IDDFADPRLR ALQKRSITQA GRHLVVSHAW RNALAHDFGV EAAIVGNGVD RRCFSPARDG 
SESALRENLG LGAGPVFLSI GGVEARKNSL CMLRAFARLQ RRLPSAQLVI AGGASLLDHD 
AYQRQFSDAL TELRLPPGAV IRTGPLAQAV MPALYRLADG LVFASLKEGF GLAVLEAMAC 
GVPVIVSEIA PFTEYLGPDD AAWCDPLDVD SIARAMTAAL RPQLRAQLIE NGFAAAARHD 
WDATAQAHLA SYESLKETAD A