Gene Msil_1821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1821
Symbol
ID	7094100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	1984846
End bp	1985874
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	66%
IMG OID	643465148
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_002362128
Protein GI	217977981
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.162011
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCAGGA TGATGAAGGC CGCGGTCGTG CGCGAATTCG GCAAGCCGCT CGTGATCCAA 
GACGCGCCCA TCCCAACGCC AGGACCCGGC GAGGTTCTCG TCAAGGTCGC GGCCTGCGGC 
GTCTGCCACA CCGATTTGCA CGCCGCCGAT GGCGATTGGC CGGTCAAGCC CGCGCCGCCG 
TTCATTCCGG GCCATGAGGT CGCAGGCATC GTCGCGGCTC TCGGTCCCGG CGTCACCGAT 
CTTAAAGAGG GCGACGCCGT CGGCGTCGCC TGGCTGCATG ATTCTTGCCT GCGCTGCGAA 
TATTGCGAAA CAGGGTGGGA AACCTTGTGC GAGCATCAAC ACAACACAGG CTATAACGTC 
AACGGCGGCT TCGCTGAATA TGTGATCGCG GCCGCCCCCT TCGCAGCGAA GCTGCCGACG 
AATATCGACT TCGCGGAGAT CGCGCCGATC CTCTGCGCCG GGGTCACCAC CTACAAGGGC 
ATCAAGGAAA CCGAAGCAAG GCCCGGCGAA TGGCTCGCCA TTTCGGGCGT CGGCGGGCTT 
GGCCATGTCG GCATCCAATA TGCCAAAGCG ATGGGCCTGC ATGTCGCCGC GCTCGACATC 
GCGCCCGAAA AGCTCGACCT CGCCATGGCG GCGGGCGCGG ACATCGCCAT CGACGCGCGA 
GAGCCGGACG CCGTGGCGCA AGTCATCAAG GCGACGGGCG GCGGCGCCCA TGGCGTGCTG 
GTGACGGCCG TCTCGCCGCC GGCCTTCGGC CAAGCCATTC GTCTCGTGCG CCGCAACGGC 
ACCGTGAGCC TCGTCGGCCT GCCGCCCGGC GACTTCCCGA CGCCGATCTT CGAGGTGGTG 
CTGAAGCGCA TCACGATTCG CGGCTCGATC GTCGGCACGC GCCGCGACCT CGACGAGGCG 
ATCGCCTTCG CCGCCGAGGG CAAGGTCAAG GCGCAGATCG CGCGGGCGCC GCTCGAAGAC 
ATCAACGATA TTTTCGCAAA GCTGAAGGCC GGCGAGATCG AGGGACGGAT GGTTCTCGAT 
TTTCCGTGA

Protein sequence

MVRMMKAAVV REFGKPLVIQ DAPIPTPGPG EVLVKVAACG VCHTDLHAAD GDWPVKPAPP 
FIPGHEVAGI VAALGPGVTD LKEGDAVGVA WLHDSCLRCE YCETGWETLC EHQHNTGYNV 
NGGFAEYVIA AAPFAAKLPT NIDFAEIAPI LCAGVTTYKG IKETEARPGE WLAISGVGGL 
GHVGIQYAKA MGLHVAALDI APEKLDLAMA AGADIAIDAR EPDAVAQVIK ATGGGAHGVL 
VTAVSPPAFG QAIRLVRRNG TVSLVGLPPG DFPTPIFEVV LKRITIRGSI VGTRRDLDEA 
IAFAAEGKVK AQIARAPLED INDIFAKLKA GEIEGRMVLD FP