Gene Namu_3163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3163
Symbol	hisD
ID	8448777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3483816
End bp	3485123
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	75%
IMG OID	645042244
Product	histidinol dehydrogenase
Protein accession	YP_003202485
Protein GI	258653329
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0133294
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000240605
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTTCAAC GGATCGACCT ACGTGCCGGC CTGCCCCGGG TGCTCGGCGA CGTGCTGCCC 
CGGGCGGCCG TCGACATCGG TTCGGCGACC GCGACGGTCG CCCCGATCAT CGAGGACGTC 
CGTCATCGTG GCGCGGCGGC CGTGCTGGAC GCGGCGCAGC GGTTCGACGG CGTGCGCCCG 
GCCGCGGTTC GGGTCCCGGT CGAGGTGATC GAGGCGGCCT CCGGCGCGCT GACCGGTTCG 
CTGCGGGCCG CGCTGGTGGA GTCCATCGCC CGCGCCCGGG TCGGGCACGC CGCGCAGCTG 
CCGGCCGAGA CGGTGACCAC GCTGGCCTCC GGTGCCCTGG TGCGGCAGCG GTGGGTGCCG 
GTGCGCCGGG TCGGGCTGTA CGTGCCGGGC GGGCGCGCGC TGTACCCGTC GAGTGTGGTG 
ATGAACGTGG TGCCCGCGCA GGTCGCGGGC GTCGACGCGA TCGCCGTCAC CTCGCCGCCG 
CAGAAGGACA ACGACGGCTG GCCGGACCGC AACGTGCTGG CCGCCTGCGC CCTGCTGGAC 
ATCGATGAGG TCTACGCCGC CGGCGGGGCC CAGGGCATCG CGCTGCTGGC TCTGGGTGCC 
GATGGCGTCG AACCGGTCGA CGTGATCACC GGACCGGGCA ACGTCTACGT CACCGCGGCC 
AAGCGGCTGC TGCGCGGTGT CGTCGGCATC GACTCGGAGG CCGGCCCCAC CGAGATCGCC 
GTGGTCGCTG ACGACTCCGC CGACCCCGAG TACGTCGCCG CCGACCTGAT CTCGCAGGCC 
GAGCACGACC CGCTGGCCGC CTCGGTGCTG ATCACCACCT CGACCGAGCT GGCCGACGCG 
GTCGACGCCG TGCTGCCGGC CCGGGTGGCC GCGACCAAGC ACAGCGAGCG GATCACCGAG 
GCGCTGACCG GCCCGCAGTC CGGCGTGGTG CTGGTCGCCG GCATCGACGA CGCGCTGGCC 
GTGGCCGACG CATACGCCGC CGAGCACCTG GAGATCCAGA CCCGGGACGC CGCCGCCGTG 
GCCGCCCGGG TGCGCAATGC CGGCGCGGTG TTCGTCGGCG CGTACTCACC GGTATCGCTG 
GGCGACTACT GCGCCGGGTC CAACCACGTG CTGCCCACCG GCGGGTCGGC CCGGTTCTCC 
GCCGGCCTGG CCGCCACCAC GTTCCTGCGG CAGCAGCAGG TGATCGACTA CTCCGCCGAT 
GCGCTGCGCG AGGTGGGTCC ACACGTCGCC GCCCTGTCGG CCGCGGAGGA CCTGCCCGCG 
CACGGCGAGG CGGTCGCCGT GCGGCTGACG GCGCGGGACG GCTCATGA

Protein sequence

MLQRIDLRAG LPRVLGDVLP RAAVDIGSAT ATVAPIIEDV RHRGAAAVLD AAQRFDGVRP 
AAVRVPVEVI EAASGALTGS LRAALVESIA RARVGHAAQL PAETVTTLAS GALVRQRWVP 
VRRVGLYVPG GRALYPSSVV MNVVPAQVAG VDAIAVTSPP QKDNDGWPDR NVLAACALLD 
IDEVYAAGGA QGIALLALGA DGVEPVDVIT GPGNVYVTAA KRLLRGVVGI DSEAGPTEIA 
VVADDSADPE YVAADLISQA EHDPLAASVL ITTSTELADA VDAVLPARVA ATKHSERITE 
ALTGPQSGVV LVAGIDDALA VADAYAAEHL EIQTRDAAAV AARVRNAGAV FVGAYSPVSL 
GDYCAGSNHV LPTGGSARFS AGLAATTFLR QQQVIDYSAD ALREVGPHVA ALSAAEDLPA 
HGEAVAVRLT ARDGS