Gene Namu_5009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5009
Symbol
ID	8450640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5587257
End bp	5588243
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	72%
IMG OID	645044047
Product	aldo/keto reductase
Protein accession	YP_003204271
Protein GI	258655115
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	61
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACATGC GCACGATCGA CCGGCTGGGA CGCGAGGTCT CGGAGGTGGG GCTGGGCACG 
TGGCAACTCG GGGCCGACTG GGGCGAGGTC AGCACCGACG ACGCGCTGGC CATCCTGGAC 
GCCGCCTACG ACAGCGGTGT CCGGTTCTTC GACACCGCCG ACGTCTACGG CGACGGGGTC 
AGCGAGCAGA CCATCGGGAC CTTCCTGCGC ACCCGCGGCC ACACCGACCT GGTGGTGGCG 
ACCAAGATGG GCCGCCGCGC CTCGCCGCAC GAGGCCGCGG CGTACACGCT GGACAACTTC 
CGGGCCTGGA CCGACCGGTC CCGGACCAAC CTGGGCGTCG AGGTCCTCGA CCTGGTTCAG 
CTGCACTGCC CGCCCACCTC GGTGTATTCC GACGACGAGG TGTTCGGCGC GTTGGACACG 
CTGGTCGCCG AGGGCCGGAT CCGGGCCTAC GGGGTGAGTG TGGAGACCCG GGACGAGGCG 
CTGACCGCGA TCGCCCGGCC CGGGGTGGCC AGCGTGCAGA TCGTGTTCAA CATGCTGCGC 
CAGGCCCCGC TGGACCGGGT GCTGCCGGCG GCCGCCGCCG CGGGCGTCGG CATCATCGCC 
CGGGTGCCGC TGGCCAGTGG CCTGCTGTCG GGCAAGTACG ACCGCACCAC CACCTTCCCG 
GCCAACGATC ACCGCACCTA CAACCGCCGG GGCGAGGCCT TCGACGTCGG CGAGACCTTC 
GCCGGGGTGG ACTTCAGCAC CGGCCTGGAG GCCGTGCAAC GGCTGCTTCC GCTGGTCCCC 
GCACCGGCCA CGATGGCCCA GTTCGCGCTG CGCTGGATCC TGGACCAGCC CGGCGTCAGC 
TCCGTCATCC CCGGTGCGCG CAACGCCGTG CAGGCCCTGG GCAATGCCGC GGCGGCCGAC 
CTGGCCCCGC TGACCCCGCA GGTGCTGGCC GCGGTGACCG AGGTCTACCA GGAGCTGATC 
GCCCCCCAGA TCGGCGACCG TTGGTAG

Protein sequence

MDMRTIDRLG REVSEVGLGT WQLGADWGEV STDDALAILD AAYDSGVRFF DTADVYGDGV 
SEQTIGTFLR TRGHTDLVVA TKMGRRASPH EAAAYTLDNF RAWTDRSRTN LGVEVLDLVQ 
LHCPPTSVYS DDEVFGALDT LVAEGRIRAY GVSVETRDEA LTAIARPGVA SVQIVFNMLR 
QAPLDRVLPA AAAAGVGIIA RVPLASGLLS GKYDRTTTFP ANDHRTYNRR GEAFDVGETF 
AGVDFSTGLE AVQRLLPLVP APATMAQFAL RWILDQPGVS SVIPGARNAV QALGNAAAAD 
LAPLTPQVLA AVTEVYQELI APQIGDRW