Gene Namu_2340 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2340
Symbol
ID	8447951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	2581351
End bp	2582385
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	75%
IMG OID	645041461
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_003201705
Protein GI	258652549
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0000105685
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00137453
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAAGGCGG TGGTGTTCGC CGGGGACGGC CAGGTGCGGG TCGATTCGGT GCCCACGCCG 
ACGATCTCGC AGCCGCAGGA CGCGCTGGTC CGGGTCCGCC GGGCGGCCGT CTGCGGCACC 
GACCTGCACG CCGTCGCCCA CCCCGACGGG CTGCCGGTCG GGACCGTGCT CGGGCACGAG 
TTCGCCGGCG AGGTGATCGA GGTCGGCCCG GCCGTGCAGA CCCATCAGCC CGGGACCATC 
GTGTACGGCT CGGATTTCAC CGCCTGCGGG CACTGCTGGT GGTGCCGGGC CGGCGACCAC 
TGGGAGTGCC CGCAACGACG GTTCTTCGGC ACCGGCACCG CCTTCGGCCC GGCCCTGCCG 
GGCGCGCAGG CGCAGTTGCT ACGGGTCCCG TTCGCCGACA CCGCGCTGCG TGCGGTGCCG 
GCCGGGCTGA GCCTGGACGC GGCCGTGTTC CTGGGCGACA CGTTGGCTAC CGGCTACGCC 
GCGGTGAGCC GGGCGCAGCT GCGCGCGGGG GGCACCGTCG CGGTCCTGGG CGGCGGCCCG 
GTCGGCCAGT TGATCAGCCT GGCCGCCCAG GCATGCGGAG CGGGCGTCGT CGTGGTGGTC 
GAACCGGTGG CCGATCGGCG GGAACTGGCC GCCGCGCAGG GCGCGGTGGT CGCCGAACCG 
GAACTGGCCC GGACCCTGAT CGACCGGGTC ACCGACGGGC GGGGCGCCGA TGCGGTCATC 
GACGCGGTCG GCGGGCCGCG GGCCCTGGAC ACCGCCTGCG CGCTGGTCCG GCGCCGCGGT 
TCGGTGATCT CGGTCGGCGT GCACCGGGAC CTGGCCTGGT CGCTGCCGGT GGCCCGGGCC 
TTCGCCGACG AGCTGACCCT GCGCTTCGTG ATCGGCGATG CGATGCGTGA CGGCGACGCC 
CTGGTGGACC TGGTCCGTTC GGGCGCGATT GACCCCACGG TGCTGGTCTC GGACACGGTC 
GGTCTCGACG ACGTGCCCGA GGCGTACCGC CGGATGGCGG ATCGACGTAC GCTCAAGACA 
CTCATCGCGG TGTGA

Protein sequence

MKAVVFAGDG QVRVDSVPTP TISQPQDALV RVRRAAVCGT DLHAVAHPDG LPVGTVLGHE 
FAGEVIEVGP AVQTHQPGTI VYGSDFTACG HCWWCRAGDH WECPQRRFFG TGTAFGPALP 
GAQAQLLRVP FADTALRAVP AGLSLDAAVF LGDTLATGYA AVSRAQLRAG GTVAVLGGGP 
VGQLISLAAQ ACGAGVVVVV EPVADRRELA AAQGAVVAEP ELARTLIDRV TDGRGADAVI 
DAVGGPRALD TACALVRRRG SVISVGVHRD LAWSLPVARA FADELTLRFV IGDAMRDGDA 
LVDLVRSGAI DPTVLVSDTV GLDDVPEAYR RMADRRTLKT LIAV