Gene Noca_3045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3045
Symbol	hisD
ID	4600162
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	3241998
End bp	3243296
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	75%
IMG OID	639777651
Product	histidinol dehydrogenase
Protein accession	YP_924234
Protein GI	119717269
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCCGCC GCATCGACCT GCGAGGCGCC GACCCGGGTG TCGACTACCG GGCAGCCGTG 
CCCCGTGCCG ACTTCGACAT CGAGGCCGCG GTCCCGGCGG TGCATGCGAT CTGCGAGGAC 
GTCCGGACCC GCGGGCTGGA CGCGATCCGC GAGCTCTCGG AGCGCTTCGA CGGCGTCGCC 
GTGGACGACA TCCGGGTCGC CCCGGAGGCG CTGGCCACCG CGCTCGAGCG GCTCGACCCC 
GACATCCGGG CCGCCCTGGA GGAGTCGATC GCGCGGCTGC GGGCCACCTG CGCGAACGAG 
CTCGAGCAGG ACGCCGTCAC CGACCTCGGC CCCGGCGCCC GGGTCACCCA CCGCAAGGTG 
CCGGTCGGCC GGGTCGGCCT CTACGTCCCC GGCGGGCTGG CCCCGCTGGT CTCCAGCGTG 
CTGATGAACG TCGTGCCGGC CCAGACCGCC GGCGTCGGGT CGATCGCGCT CGCGAGCCCG 
CCCCAGCGTG AGTTCGCAGG CGCGGTGCAC CCGACGATCC TGGCGGCGTG CGCGCTGCTG 
GGGGTCGAGG AGGTGTACGC CGTCGGCGGC GCCCAGGCGA TCGCGATGTT CGCCTACGGC 
ACCGGGCCGT GCCGGCGGGT CGACCTGGTG ACCGGGCCCG GCAACATCTA CACGGTCACC 
GCCAAGCGGC TGCTCAAGGG CCTGGTCGGT ATCGACTCGG AGGCGGGCCC CACCGAGATC 
GCGATCCTCG CCGACGACAC GGCGGACCCG GCGTACGTCG CCGCCGACCT GCTCAGCCAG 
GCCGAGCACG ACCCGCTCGC CGCCGCCGTG CTCGTCACGC CCTCCGACCG GCTGGCCGAC 
GCGGTCGCGG CCGAGCTCGA GACGCAGGTC GCGGCCACCA AGCACGTCGA ACGGATCCGC 
ACCAGCCTCT CCGGGCGGCA GTCCGGGGTC GTCCTCGTCG ACGACCTCGA GCAGGGCCTC 
GAGGTCGTGA ACGCCTACGC CGCCGAGCAC CTCGAGATCC ACACCGAGGA CGCCGCGGCG 
TACGCCGCCC GGGTCCGCAA CGCCGGCGCG ATCTTCGTCG GCCCCTACGC CCCGGTCAGC 
CTCGGCGACT ACTGCGCCGG CTCCAACCAC GTGCTGCCGA CCGCCGGCTG CGCCTGCCAC 
TCCTCGGGCC TCTCGGTGCG CGCGTTCACC AAGTCGGTCC ACGTGGTCGA CTACTCCCGC 
GCGGCGCTCG ACGCCGTGGC CGGGCACGTC GTCACGCTGG CCGAGGCCGA GGACCTCCCC 
GGCCACGGCG CGGCCGTCCG GGTGCGGTTC GGGGGCTGA

Protein sequence

MIRRIDLRGA DPGVDYRAAV PRADFDIEAA VPAVHAICED VRTRGLDAIR ELSERFDGVA 
VDDIRVAPEA LATALERLDP DIRAALEESI ARLRATCANE LEQDAVTDLG PGARVTHRKV 
PVGRVGLYVP GGLAPLVSSV LMNVVPAQTA GVGSIALASP PQREFAGAVH PTILAACALL 
GVEEVYAVGG AQAIAMFAYG TGPCRRVDLV TGPGNIYTVT AKRLLKGLVG IDSEAGPTEI 
AILADDTADP AYVAADLLSQ AEHDPLAAAV LVTPSDRLAD AVAAELETQV AATKHVERIR 
TSLSGRQSGV VLVDDLEQGL EVVNAYAAEH LEIHTEDAAA YAARVRNAGA IFVGPYAPVS 
LGDYCAGSNH VLPTAGCACH SSGLSVRAFT KSVHVVDYSR AALDAVAGHV VTLAEAEDLP 
GHGAAVRVRF GG