Gene Msil_3210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3210
Symbol
ID	7090625
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	3524847
End bp	3525875
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	64%
IMG OID	643466518
Product	aldo/keto reductase
Protein accession	YP_002363479
Protein GI	217979332
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.0255002
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTACA GGCGTCTTGG ACGATCCGGC TTTAGCGTGC CGGTTCTCAG CTTCGGCACC 
GGCACTTTCG GCGGCAAGGG CGAGCTCTTC GCCGCCTGGG GCGCGACCGA CGTCAAGGAG 
GCGAGCCGGC TCGTCGATAT CTGTCTCGAC GCGGGGCTGA CGATGTTCGA CAGCGCCGAC 
ATCTACTCGT CGGGCGTTGC CGAACAGGTG CTCGGCGAGG CCATCAAGGG CCGCCGCAAT 
CAGGTCCTGA TCTCGACCAA AGCGACCTTT CGCTCCGGCC CCGGCCCGAA CGAGGTCGGC 
TCGTCGCGCT TCCATTTGAT CGAGGCCGTC GAAGCCGCTC TAAAGCGCCT GCAGACCGAC 
CATATCGATC TCTTTCAGCT GCATGCCTTC GACGCCATGA CTCCCGTCGA GGAGACGCTG 
TCGGCGCTCG ACGATCTGAT CCGCGCGGGA AAAATTCGCT ACATCGGCTG CTCGAACTTT 
TCGGGCTGGC ATCTGATGAA GTCGCTCGCC ACAGCAGACC GCTATAATCT GCCACGCTAC 
ATCGCGAATC AGGCTTATTA TTCGCTGGTC GGGCGCGACT ATGAATGGGA GCTGATGCCG 
CTCGGGCTTG ACGAAGGCGT CGGCGCGATG GTCTGGAGCC CTCTTGGCTG GGGCCGGCTC 
ACCGGCAAGA TCAGGCGCGG GCAGCCGCTG CCCGAGGTCA GTCGGCTGCA CAAGACCAAG 
GACATCGGGC CGCAGGTGGA GGACGATTAT CTCTACGACG TCGTCGACGC CCTCGATGAG 
ATCGCCAAGG AAACCGGCAA GTCGGTTCCG CAGATCGCGC TCAACTGGCT GTTGCAGCGT 
CCGACCGTGT CGAGCGTCAT CATCGGCGCG CGCGACGAGG AGCAGCTGAA GCAAAATCTG 
GGGGCGGTCG GCTGGTCCCT TGCCGCGGAG CAGATCGCAA AGCTCGACGC GGCAAGCCAG 
CGCGAGCCCG CCTATCCCTA TTGGCACCAG CGCGGCACCT TTGTGGAGCG CAATCCTCTG 
CCGGTCTGA

Protein sequence

MDYRRLGRSG FSVPVLSFGT GTFGGKGELF AAWGATDVKE ASRLVDICLD AGLTMFDSAD 
IYSSGVAEQV LGEAIKGRRN QVLISTKATF RSGPGPNEVG SSRFHLIEAV EAALKRLQTD 
HIDLFQLHAF DAMTPVEETL SALDDLIRAG KIRYIGCSNF SGWHLMKSLA TADRYNLPRY 
IANQAYYSLV GRDYEWELMP LGLDEGVGAM VWSPLGWGRL TGKIRRGQPL PEVSRLHKTK 
DIGPQVEDDY LYDVVDALDE IAKETGKSVP QIALNWLLQR PTVSSVIIGA RDEEQLKQNL 
GAVGWSLAAE QIAKLDAASQ REPAYPYWHQ RGTFVERNPL PV