Gene Ndas_3192 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3192
Symbol
ID	9247049
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3816422
End bp	3817717
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	75%
IMG OID
Product	histidinol dehydrogenase
Protein accession	YP_003681106
Protein GI	297562132
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.142432
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCAGTC GAATCGACCT CCGAGGCACC CAAGGCGACC CGCGTCAGGC CCTTCCGCGC 
GCGGAACTGG ACGTGGCGGC CGCCGCCGAG CGCGTACGCC CCCTGTGCGA GGACGTGCGC 
CATCGCGGTG TCGAGGCCCT GGTCGAACTC ACCGAGCGCT TCGACGGCGT CAGACTGACC 
GACATCCGCG TGCCCAAGGA CGCGATCGAG GCCGCCCTGG ACGGCCTCGA CCCCGCCGTG 
CGCGCCGCGC TGGAGGAGTC CATCCGCCGC GCCCGCGCGG TCCACCGCGA CCAGCGCCGC 
ACCGACCACA CCACCCGCGT CGTGCCCGGG GGCACCGTCA CCGAGAGGTG GATCCCCGTC 
GACCGCGTCG GCCTCTACGT GCCGGGCGGC CGGGCCGTCT ACCCCTCCAG CGTCGTCATG 
AACGTCGTCC CCGCCCAGGA GGCGGGGGTG CGCTCCCTGG CGGTCACCTC GCCGCCCCAG 
AGCGCCTTCG GCGGGCTGCC CCACCCGACC ATCCTCGCCG CCTGCGCCCT GCTCGGCGTC 
GACGAGGTCT ACGCCGTCGG GGGCGCCCAG GCGATCGCCA TGTTCGCCTA CGGCGCGGGC 
CCCTGCGAGC GCGCCGACAT GGTCACCGGC CCCGGCAACA TCTGGGTGGC CGCGGCCAAA 
CGCCTGCTCA AGGGCGTCAT CGGCATCGAC GCCGAGGCCG GTCCCACCGA GATCGCGATC 
CTCGCCGACG CCACCGCCAA CCCCGACTAC GTCGCCGCCG ACCTGATCAG CCAGGCCGAG 
CACGACGTCG TCGCCGCCTC CGTCCTGGTC ACCCCGGACG AGGCGCTCGC CGAGGCGGTC 
ACCGACCGCC TCGCCGCCCG CGTGGCCGCC ACCAAGCACG GCGACCGCGT CCGCGAGGCC 
CTGTCCGGCC CGCAGTCCGG CATCGTCCTG GTCGACGACC TCGACCACGG CCTCGCCGTC 
GTCAACGCCT ACGCCGCCGA GCACCTGGAG GTCATGACCG CCGACGCCGC CGCGTGTGCC 
GCGCGCGTGC GCAACGCGGG CGCGATCTTC GTCGGCGACT TCTCGCCGGT CTCCCTGGGC 
GACTACGCGG CCGGGTCCAA CCACGTGCTG CCCACCGGAG GCTGCGCCTG CCACACCGGC 
GGCCTGAGCG TGCAGACCTT CCTACGCGGC GTGCACGTGG TCGAGTACGA CCGCGAGGCG 
CTGACCGACG TCGCCCACCA CGTCATCGCC CTGGCCAACG CCGAGGACCT GCCCGCGCAC 
GGCGAGGCCG TCGCCGCGCG CACGGACCCG GCCTGA

Protein sequence

MISRIDLRGT QGDPRQALPR AELDVAAAAE RVRPLCEDVR HRGVEALVEL TERFDGVRLT 
DIRVPKDAIE AALDGLDPAV RAALEESIRR ARAVHRDQRR TDHTTRVVPG GTVTERWIPV 
DRVGLYVPGG RAVYPSSVVM NVVPAQEAGV RSLAVTSPPQ SAFGGLPHPT ILAACALLGV 
DEVYAVGGAQ AIAMFAYGAG PCERADMVTG PGNIWVAAAK RLLKGVIGID AEAGPTEIAI 
LADATANPDY VAADLISQAE HDVVAASVLV TPDEALAEAV TDRLAARVAA TKHGDRVREA 
LSGPQSGIVL VDDLDHGLAV VNAYAAEHLE VMTADAAACA ARVRNAGAIF VGDFSPVSLG 
DYAAGSNHVL PTGGCACHTG GLSVQTFLRG VHVVEYDREA LTDVAHHVIA LANAEDLPAH 
GEAVAARTDP A