Gene Dret_1370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1370
Symbol	hisD
ID	8419199
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	1597877
End bp	1599187
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	61%
IMG OID	645037946
Product	histidinol dehydrogenase
Protein accession	YP_003198236
Protein GI	258405494
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.304099
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.714962
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTGTC GAAGCCTGAC CTACTCTTCT GCCCAGGACT GGGCCGCCAT TCGTGCATGG 
CTCGCTCCGC GGACTGAACC CGACACCTCG GTGGAGGGCC CGGTGCGCGA GATACTCCAA 
GAAGTGCAAC AGCACGGCGA TGCCACTTTG GTCAAATACA CCCAGCGTTT CGATTGCCCG 
GATTTCCAAG CCCATATGCT GGCGGTGCCC CAGGAACAGA TCGAGGCTGC TGTACAGGAA 
ATTCCCGCCG AGGACAAACG GATTATTGAG GAGGCCGCGG CCAACATCAG GGATTATCAC 
GCCAAACAGC AGGAAAACTC CTGGTTCACC CCCCAAAGCG GCGGCACGAT ACTGGGCCAG 
ATCGTTCGCC CTGTGGACCG GGCTGGGCTC TACGTTCCAG GCGGACAGGG AGGCGATACC 
CCGCTCTTGT CCAGTCTGCT CATGAACGCC ATTCCCGCCC AGGTGGCCGG GGTTGGGGAC 
ATCTCCCTGG TGACCCCTCC AAGGGTGGAT GGGACCGTCA ATCCCTATAT CCTGTGTACA 
GCGGGCATTC TCGGCTTAGA CCGTGTTTTC GCCGTTGGCA GTGCCTGGGC CGTCGCCGCC 
TTGGCCTTCG GCACCGAAAC CCTTCCCTGC GTCGACGTCA TTGCCGGACC GGGAAACATC 
TTTGTGGCCA CAGCCAAACG GCTGTTGCAG GGCCAGATCG GCATCGACAT GGTCGCCGGT 
CCCAGTGAAA TCGCCATCGT AGCGGACGCA AGCGCTTCAG CCGAACGGCT GGCCGCGGAC 
ATGCTCTCCC AGGCCGAACA CGACCCCCTG GCGTCGAGTA TTCTGATAAC CGACTCGCAG 
GACCTGCTGC AAACCACCCA ACAGGAATTG GAACGCCAGC TCGCCGAATT GCCCCGCAAT 
ACCATCGCCC GGCAGTCGCT CTCGGACTGG GGGGCCTGCA TTCGTGTTCC GGACACGGCC 
ACCGGACTGG AACTCGCCAA TCGTCTTGCC CCGGAGCACC TTGAACTCTG CCTGGAATCA 
CCCTGGCAGT GGATCGATCA AGTCCACCAT GCCGGAGCGG TTTTCCTCGG TCACAGCACC 
CCGGAACCTG TTGGCGATTA TTTCGCCGGA CCGAACCACG TCCTGCCGAC CATTGGCACG 
GCCCGATTCA GTTCCGCCCT TTCGGTCCAG AATTTCACCA AGAAGACAAG CCTCATCGCC 
ACTTCGGACG CCTATATCCA GGAGCATGGG GCCAAGATCG CTCGAATGGC CCGCCTCGAA 
GGGCTTGAGG CCCACGCCAG AAGCGTCGAG ACCCGGTATC GGTGTTTGTG A

Protein sequence

MTCRSLTYSS AQDWAAIRAW LAPRTEPDTS VEGPVREILQ EVQQHGDATL VKYTQRFDCP 
DFQAHMLAVP QEQIEAAVQE IPAEDKRIIE EAAANIRDYH AKQQENSWFT PQSGGTILGQ 
IVRPVDRAGL YVPGGQGGDT PLLSSLLMNA IPAQVAGVGD ISLVTPPRVD GTVNPYILCT 
AGILGLDRVF AVGSAWAVAA LAFGTETLPC VDVIAGPGNI FVATAKRLLQ GQIGIDMVAG 
PSEIAIVADA SASAERLAAD MLSQAEHDPL ASSILITDSQ DLLQTTQQEL ERQLAELPRN 
TIARQSLSDW GACIRVPDTA TGLELANRLA PEHLELCLES PWQWIDQVHH AGAVFLGHST 
PEPVGDYFAG PNHVLPTIGT ARFSSALSVQ NFTKKTSLIA TSDAYIQEHG AKIARMARLE 
GLEAHARSVE TRYRCL