Gene Amir_4646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_4646
Symbol
ID	8328844
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	5531325
End bp	5532425
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	76%
IMG OID	644945092
Product	mycothiol-dependent formaldehyde dehydrogenase
Protein accession	YP_003102324
Protein GI	256378664
COG category	[C] Energy production and conversion
COG ID	[COG1062] Zn-dependent alcohol dehydrogenases, class III
TIGRFAM ID	[TIGR03451] mycothiol-dependent formaldehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCAGGA CGGTCAGTGC TGTGGTGGCG CCGGGTGGCG GCAAACCCGC CGAGCTGGTG 
GAGGTCGTGG TGCCGGACCC CGGTCCGGAC GAGGTGACCG TCCGGGTGCT GGCGTCGGGG 
GTGTGCCACA CCGACCTGCA CTACCGGGAC GGCGTCATCG CCGCCGAGGG CCCGTACCTG 
CTGGGCCACG AGGCCTCCGG GATCGTGGAG CGGGTCGGGC CGGGCGTGCG CGACGTCAAG 
CCCGGCGACT TCGTGGTGCT CAACTGGCGG GCGGTGTGCG GGCGGTGCCG GGCGTGCAGG 
CGCGGGCGGG CCGAGGCGTG CGTGGACGAC CGCACCGCCA CCACCCCGAT GACCCTGCTC 
GACGGGACGC CGCTCACCCC GGCGCTGGGC ATCGGCGCGT TCACCGAGCT GACCCTGGTG 
CACAGCGGCC AGTGCACCCC GGTGAACCCG GCGGCGGACC CGGCGGTGGT GTGCCTGCTC 
GGGTGCGGGG TCATGTCGGG GCTGGGCGCG GCGATGAACA CCGGCGGCGT GCGGGTCGGC 
GACACGGTCG CGGTGATCGG GGTCGGCGGG GTCGGCGGCG CGGCGGTCGT GGGCGCGCGG 
CTGGCCGGGG CGACGACGGT CGTGGCGGTG GACCGCGACG AGCGCAAGCG CGCCGTCGCG 
CACGAGCTGG GCGCGACCGA CTTCGTGCAC GCGGCCGAGG GCGTGGACGT GGTCGCGCGG 
GTGCGCGAGC TGACCGGCGG GCTGGGCGCC GACGTGGTCG TCGACGCCGC CGGGTCCGAG 
CAGACCTGGC GGCAGGCGTT CTACGCGCGG GCGCTGGGCG GCACGTTCGT CCTGGTCGCC 
AGGCCGGACG CGTCGATGCG GCTGGAGCTG CCGCTGCTGG ACGCGTTCCT GCGCAACGGC 
ACGTACCGCA CGAGCTGGTA CGGCGACTGC CTCCCGTCCC GCGACTTCCC GCCGCTGGTC 
GAGCTGTTCC TCCAGGACCG CCTGCCGCTG CGCCGGTTCG TGTCCGAGCG GATCGGGCTC 
GGCGACGTGG AACGCGCGTT CGAGTCGATG CGCAGGGGCG ACGTGCTGCG CAGCGTGGTC 
CTGGTGGACG GCGCGCGCTA G

Protein sequence

MSRTVSAVVA PGGGKPAELV EVVVPDPGPD EVTVRVLASG VCHTDLHYRD GVIAAEGPYL 
LGHEASGIVE RVGPGVRDVK PGDFVVLNWR AVCGRCRACR RGRAEACVDD RTATTPMTLL 
DGTPLTPALG IGAFTELTLV HSGQCTPVNP AADPAVVCLL GCGVMSGLGA AMNTGGVRVG 
DTVAVIGVGG VGGAAVVGAR LAGATTVVAV DRDERKRAVA HELGATDFVH AAEGVDVVAR 
VRELTGGLGA DVVVDAAGSE QTWRQAFYAR ALGGTFVLVA RPDASMRLEL PLLDAFLRNG 
TYRTSWYGDC LPSRDFPPLV ELFLQDRLPL RRFVSERIGL GDVERAFESM RRGDVLRSVV 
LVDGAR