Gene Msil_3239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3239
Symbol
ID	7090654
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	3553351
End bp	3554349
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	66%
IMG OID	643466547
Product	hopanoid-associated sugar epimerase
Protein accession	YP_002363508
Protein GI	217979361
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR03466] hopanoid-associated sugar epimerase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.109011
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTGCGG ACACGGTTCT GGTCACAGGA GCTTCGGGCT TCGTCGGATC GGCGGTCGCG 
CGCGCGTTGA CGCATTCGGG CTATAGCGTC AGGGCGCTGC TGCGGCCGAC GGCGACGCGT 
GAGAATCTGT ACGGGCTCGA TGCCGAAATC GTCGAAGGCG ACATGTGCGA AATGCGCTCG 
GTCGAAAAGG CGATGGCCGG CGCGCGCTTT CTTTTTCATG TCGCGGCCGA CTATCGTCTC 
TGGGCGCGCG ATCCCGGCGA AATCGTGCGC ACCAACCGCG ACGGCACGCG CGTTCTGATG 
CAGGCGGCTC TGCGCGAAGG CGTCGAACGG ATCGTCTATA CGAGCAGCGT GGCGACGATC 
GCCTGCCGGG ACAATGGCGC GCCCGCGGAT GAATCCAGCT CGCTCGCCGA ATGCAACGCC 
GTCGGCGCCT ATAAGCGCAG CAAGGTGCTG GCGGAGCAGA TCGTCAAAGA CATGATCGTG 
CGGGATCAAC TGCCGGCGAT CATCGTCCAT CCCTCGACGC CGGTCGGCCC CCGCGACGTC 
AGGCCGACGC CGACCGGGCG CATCATTCTC GAGGCGGCGA TGGGCCGCAT GCCGGGCTAT 
GTCGACACCG GCCTCAATCT CGTCCATGTC GACGACGTGG CTTCGGGTCA TGTCGCAGCG 
CTGCGCCGCG GCAAGATCGG CGAACGCTAT ATTCTGGGCG GGCAGGACGT GCCGCTCGCC 
GGCATGTTGA GGGATATTGC CGAGCTTTGC GGGCGCCATC CGCCGTGGCT GCGGCTGCCG 
CGCGCGCTCG TCTATCCCTT CGCCCTTGCC GCCGAGGCGG CGGCGCATCT CACCCACAAA 
GAACCCTTCG TGACGATCGA CGGTCTGCGC ATGTCGCGCC ACACCATGTT CTTCAGCTCG 
GCCAAGGCCG AGCGTTGCCT TGGCTATGTG GCGCGGCCCT ATCGCGAAGC GCTGAACGAC 
GCCCTGAACT GGTTCACCGA AAACGGACGG CTGAAATGA

Protein sequence

MTADTVLVTG ASGFVGSAVA RALTHSGYSV RALLRPTATR ENLYGLDAEI VEGDMCEMRS 
VEKAMAGARF LFHVAADYRL WARDPGEIVR TNRDGTRVLM QAALREGVER IVYTSSVATI 
ACRDNGAPAD ESSSLAECNA VGAYKRSKVL AEQIVKDMIV RDQLPAIIVH PSTPVGPRDV 
RPTPTGRIIL EAAMGRMPGY VDTGLNLVHV DDVASGHVAA LRRGKIGERY ILGGQDVPLA 
GMLRDIAELC GRHPPWLRLP RALVYPFALA AEAAAHLTHK EPFVTIDGLR MSRHTMFFSS 
AKAERCLGYV ARPYREALND ALNWFTENGR LK