Gene Msil_3685 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3685
Symbol
ID	7093039
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	4046193
End bp	4047188
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	66%
IMG OID	643466972
Product	aldo/keto reductase
Protein accession	YP_002363931
Protein GI	217979784
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.181793
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACGC GTCAACTTGG GGCCAAAGGG CCGCCCGTCT CGGCCATTGG CCTTGGCTGC 
ATGGGAATGT CGGATTTCTA TGGACCGTCC GATCGCGAGG AAAGCATCGC GACGATCCAC 
GCCGCGCTCG ACGCGGGCGT GACGCTGCTC GATACCGGCG ATTTCTATGG CATGGGCCAT 
AATGAGATGC TGATCGCCGA GGCGCTGCAG GGGGTGAGCC GCGAGGCCTT TCAGGTCAGC 
GTCAAATTCG GGGCGCAACG CGATCCTTCC GGCGCCTGGA TCGGGTTCGA CGCGCGCCCC 
CAGGCGGTGA AGACTTCGCT GACCTATTCG CTGCGCCGGT TGCGGCTCGA TTACGTTGAC 
GTCTATCGCC CGGCTCGCCT CGATCCGCAT GTGCCGATCG AGGACACGGT CGGCGCCATC 
GCCGATATGG TCAAGGCCGG CTATGTCAGG GAAATCGGCC TGTCCGAGGT CGGCAGCGAG 
ACGCTGCGGC GCGCGGCGGC CGTGCATGCG ATCGCCGATC TGCAAATCGA ATATTCGCTG 
ATCTCGCGCG GCATCGAGGG CGGCGTTCTC TCCACATGTC GCGAACTTGG GATTGCGCTC 
ACCGCCTATG GCGTACTGTC GCGCGGGCTG ATCAGCGGGC ATTGGCGCCC CGGGCCGCTC 
GAGCCAGGCG ATTTTCGCTC GCGCAGCCCG CGTTTCCAGG AGGGCAATGT CGACAAGAAT 
CTCCAGCTCG TCGAGGCGCT GCGGAAACTG GCGGCAGAGA AGGGCGCAAG CGTCGCGCAG 
ATTGCGATCG CCTGGGTTCT GGCGCAGGGC GAGGACATCA TCCCGCTCAT CGGCGCGCGG 
CGGCGCGACC GCCTCGCTGA GGCTCTTGGC GCCCTCAACG TCACGCTGAC GCCGAAGGAT 
ATTTCTGCGA TCGAGGCGAT CGCGCCCAAA GGCGCCGCCG CGGGCGAGCG CTACGACGCC 
CCGCAAATGG CCTTTCTCGA CAGCGAGCGG GGGTAG

Protein sequence

MKTRQLGAKG PPVSAIGLGC MGMSDFYGPS DREESIATIH AALDAGVTLL DTGDFYGMGH 
NEMLIAEALQ GVSREAFQVS VKFGAQRDPS GAWIGFDARP QAVKTSLTYS LRRLRLDYVD 
VYRPARLDPH VPIEDTVGAI ADMVKAGYVR EIGLSEVGSE TLRRAAAVHA IADLQIEYSL 
ISRGIEGGVL STCRELGIAL TAYGVLSRGL ISGHWRPGPL EPGDFRSRSP RFQEGNVDKN 
LQLVEALRKL AAEKGASVAQ IAIAWVLAQG EDIIPLIGAR RRDRLAEALG ALNVTLTPKD 
ISAIEAIAPK GAAAGERYDA PQMAFLDSER G