Gene Amir_3365 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_3365
Symbol
ID	8327555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	3938634
End bp	3939644
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	73%
IMG OID	644943871
Product	aldo/keto reductase
Protein accession	YP_003101111
Protein GI	256377451
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTTACC GATTTCTTGG CGGCTCCGGG CTGCGCGTGT CGGAGTTGTC GCTGGGAACG 
GGCAATTTCG GCACCGGCTG GGGGCACGGG GCGCAGGCGT CCGAGGCGCG GGCGATGTAC 
GACGCCTACC GGGAAGCGGG CGGGAACTTC ATCGACACCG CCTCCAACTA CCAGGCCGGC 
GACGCCGAGG AGCACCTGGC GGACATCATC GCCTCGGACC GTGAGGACGT GGTCCTGGCG 
ACGAAGTACA GCGCGGGGAC CACGCCGGCC AGCGGCCTGC ACCTGACCGG CAACAGCCGC 
AAGGCCATGG TCCAGTCCCT GGAGCAGAGC CTGCGCAGGC TGGGCACCGA CCGGGTGGAC 
GTCTTCTGGG CGCACGTGGC CGACGGGGGC ACGCCCGTGG AGGAGGTGCT GCGGGCCTTC 
GACGACCTGA CGCGCGCGGG CAAGGTCCTG TACACCGGGC TGTGCAACTT CCCCGCGTGG 
CGCGTGGCCG CCGGGACCGT GCTGGCGCGG CAGCGCGGGT GGTCGCCCGT CACGGCGATC 
CAGGTCGAGT ACAGCCTGGT CGAGCGCGCC GCCGACCGGG AGCTGCTGCC GATGGCGGAG 
GCCCTCGGGC TGGGCGTGCT CGGGTTCTCG CCCCTCGGCG GCGGGCTGCT GACCGGCAAG 
TACCGGCGGG GTGGGACGGG GCGGGCGGAG AGCGTGCTCA GCCAGTTCCT CCACCGGGAG 
GACGACCCGG CCACGACGGG GGTCCTGGAC GCGGTCGAGA GCGTCGCCCA GGACCTCGGC 
GCGACCCCGG ACCAGGTGGC GATCAGGTGG TCGATGGCCA GGGGCGTGAT CCCGATCATC 
GGGCCGAGGG ACCTGGCCCA GTTCACGTCG AACCTCGCGG CGGCCGAGCT GGAGATCCCG 
GCGCACCACC TCGACCGGTT GACCGAGGTG AGCGCGCCGC GACTGGGGTA CCCGCACGGG 
CTGTGGGTCG AGCACGACCG GGTCGAGCGG AAGCGGCTCG CCCAGGTGTA G

Protein sequence

MRYRFLGGSG LRVSELSLGT GNFGTGWGHG AQASEARAMY DAYREAGGNF IDTASNYQAG 
DAEEHLADII ASDREDVVLA TKYSAGTTPA SGLHLTGNSR KAMVQSLEQS LRRLGTDRVD 
VFWAHVADGG TPVEEVLRAF DDLTRAGKVL YTGLCNFPAW RVAAGTVLAR QRGWSPVTAI 
QVEYSLVERA ADRELLPMAE ALGLGVLGFS PLGGGLLTGK YRRGGTGRAE SVLSQFLHRE 
DDPATTGVLD AVESVAQDLG ATPDQVAIRW SMARGVIPII GPRDLAQFTS NLAAAELEIP 
AHHLDRLTEV SAPRLGYPHG LWVEHDRVER KRLAQV