Gene Nmul_A0819 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0819
Symbol	hisD
ID	3786688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	933606
End bp	934928
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	55%
IMG OID	637810905
Product	histidinol dehydrogenase
Protein accession	YP_411518
Protein GI	82701952
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTTCGA TAAAGAGATT GTCTTCTGCC GATACCGAGT TCGATAAGGC GCTGTCGGAA 
CTGCTGGCGT TTGAAAACAC CCAGGATGCA AAGCTGGAGG CTGCTGTCGC AGATATTCTC 
GCGAAGATCA GGACGGAGGG AGATAAAGCC TTGCTGGAAT ACACGCTCCG TTTCGATCGC 
GTGGATGCAA AATCGGCGGC GGATCTGGAA TTGCCCCGAA ATCGCCTGCA ACAAGCTCTT 
CATAACCTGC CTGGCGAGCA ACGTAACGCC CTGGAGCAGG CTGCGGAACG GGTCCGCGTC 
TATCATGAGA AACAGTTGAC GCAATCCTGG AGCTACGTGG AGCCTGACGG AACACACCTT 
GGGCAGAAAA TCACCCCTCT CGATCGTGCC GGTCTGTATG TTCCCGGCGG CAAGGCAGCC 
TACCCTTCAT CAGTCCTGAT GAACGCAATT CCCGCCAAGG TGGCAGGAGT GGGCGAACTT 
GTCATGGTGA CACCCACTCC ACAGGGCGAA GTAAATGACC TGGTGCTCGC TGCTGCGGCC 
ATTTGCGAGG TTGACCGGGT TTTCACCATA GGGGGCGCTC AAGCCGTGGG CGCACTGGCA 
TATGGCACCC CTACCGTGCC GCGAGTGGAC AAGATCGTCG GCCCGGGAAA CGCTTATGTG 
GCAACAGCCA AGCGGCATGT TTTCGGTGTG GTAGGGATCG ATATGCTCGC GGGACCTTCC 
GAAATTCTGA TCATCTGCGA TGGCAAAACC AATCCGGACT GGATTGCGAT GGACATGTTT 
TCCCAGGCGG AGCACGACGA GTTGGCGCAG GCAATCCTGC TGTCACCCGA TCTTCATTTT 
ATCGAAACAG TCGCAGCGAG TATCGTCCGG CAGCTGGAAA CGATGCCACG CAAGGAGATA 
ATCCGGACTT CGCTCGAAAA CAGGAGCGCC TTGATTCAGG TGCATGATCT GGAAGAAGCC 
TGTGAGATCG CCAACAGCAT CGCGCCCGAA CATCTGGAGT TATCAGTAGA ACAGCCGGAA 
AAGTGGGTGG AAAAAATAAG ACACGCGGGT GCGATTTTTC TGGGTCGCCA TACATCGGAA 
GCGCTGGGAG ATTATTGCGC GGGTCCCAAC CACGTCCTCC CCACTTCCCG TACTGCACGC 
TTTTCGTCGC CACTCGGAGT ATACGATTTT CAGAAACGCA GCAGCATTAT TCAGGTATCG 
GGGCAGGGAT CAGCGAAATT GGGCGCCATT GCCTCTATCC TGGCCCAAGG TGAAGGGCTG 
CAGGCACACG CAATGTCAGC GGAATATCGT TACACAAAAA AAATAGCCCT TGGAAAAAAT 
TGA

Protein sequence

MISIKRLSSA DTEFDKALSE LLAFENTQDA KLEAAVADIL AKIRTEGDKA LLEYTLRFDR 
VDAKSAADLE LPRNRLQQAL HNLPGEQRNA LEQAAERVRV YHEKQLTQSW SYVEPDGTHL 
GQKITPLDRA GLYVPGGKAA YPSSVLMNAI PAKVAGVGEL VMVTPTPQGE VNDLVLAAAA 
ICEVDRVFTI GGAQAVGALA YGTPTVPRVD KIVGPGNAYV ATAKRHVFGV VGIDMLAGPS 
EILIICDGKT NPDWIAMDMF SQAEHDELAQ AILLSPDLHF IETVAASIVR QLETMPRKEI 
IRTSLENRSA LIQVHDLEEA CEIANSIAPE HLELSVEQPE KWVEKIRHAG AIFLGRHTSE 
ALGDYCAGPN HVLPTSRTAR FSSPLGVYDF QKRSSIIQVS GQGSAKLGAI ASILAQGEGL 
QAHAMSAEYR YTKKIALGKN