Gene Haur_2013 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2013
Symbol
ID	5733902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	2502613
End bp	2503947
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	53%
IMG OID	641279157
Product	histidinol dehydrogenase
Protein accession	YP_001544784
Protein GI	159898537
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAATTC AGCTTTATAC CGATCTTGCG CAGGCTCAAC AAGGCCCATT AGCACGAGTC 
GCCTTCGATA CGGTCGAAGT TCCAGAGCGT TTACAACAAA GCCTCGACCA CATGTTTGGG 
GTTGGCACAA CGCCTGCCGC TGCGGTTGAT CAGATCTTAG CCAGTGTGCG GCGCGATGGC 
GATGCGGCCT TAGAGCACTG GAGCCGCACG ATCGAAGGCG TTGAATTAAG CCAATTTGAG 
GTCGATCGCT CGGCGATTGA AGCCGCCTAT AGCCAACTTG ATCCATTATT GGTTGAAGCG 
TTACGGATCT CTGCTGCCGA GATCGAGCGT TTTCATCGTA AGCAAACCCG CCAAAGTTGG 
GTTGATTGGT CGGATGAAGG AGCACTGGGT CAGATTGTTC TACCACTTGA GCGGATTGGG 
GCGTATGCGC CAGGTGGCAC AGCTCCCCTT CCATCGTCAT TATTGATGGG GGTAATTCCA 
GCTAAGGTAG CTGGAGTACG CGAGATTATT GTGTGCTCGC CGCCGCAACG TGATACTGGC 
GAGATCTCGC CGTTGGTCTT GGTAGCTGCC GATATTGCTG GAGTCCACCG AATTTTTCGT 
TTGGGCGGGG CACAGGCCAT TGCTGCGATG GCCTATGGCA CGAATAGTGT GCCACATGTC 
GATAAAATTA TCGGTCCAGG CAATCTGTTT GTGGTGTTGG CCAAAAAGGC GGTGTATGGC 
ACGGTTGATA TTGAAGCCTT GCCCGGCCCT ACCGAAACCA TGGTGATTGC CGATGCTGAT 
GCTAACCCTG AGCTAGTGGC TGCCGATTTA CTCGCCCAAG CCGAACATGA TTTGCTGGCT 
TCGGCGATTT TGCTTACGCC TTCGTTGGAA TTGGCCGAAA AAGTCCAGGT CGCGGTTGCT 
CGTCAACTCG AAGAGCTTGA ACGAGCTGAA ATCGCGGCCC AAGCGCTCAC CAATCGCTCA 
GGGATTGTGC TTGTCCCTTC ATTAGAGGTT GCATTCGATT TAAGTAATGC CTATGGCCCT 
GAGCACCTCT GTTTATTAGT CAACGATCCT TGGCAATATG TGGGTAAAGT ACGCAATGCT 
GGGGGCATTT TCCTTGGTGA ACGTTCGTTT GAAGTGTTGG GTGATTATGT GGCTGGGCCA 
TCGCACATTA TGCCCACTGG TGGTACGGCT CGCTATGCCT CGCCAGTCAA TGTTGACCAC 
TTCCGAAAAG TTATTTCGTT GGTTGGCTTG AACGAAAAAG CCTTGCAACG ATTAGGGCCA 
GTCGCTCAGC GTTTGGCTGA GGCCGAAGGA CTGACCGCCC ATGCGGCGGC TGTACGCCGC 
CGTTTAGAGC AATAA

Protein sequence

MPIQLYTDLA QAQQGPLARV AFDTVEVPER LQQSLDHMFG VGTTPAAAVD QILASVRRDG 
DAALEHWSRT IEGVELSQFE VDRSAIEAAY SQLDPLLVEA LRISAAEIER FHRKQTRQSW 
VDWSDEGALG QIVLPLERIG AYAPGGTAPL PSSLLMGVIP AKVAGVREII VCSPPQRDTG 
EISPLVLVAA DIAGVHRIFR LGGAQAIAAM AYGTNSVPHV DKIIGPGNLF VVLAKKAVYG 
TVDIEALPGP TETMVIADAD ANPELVAADL LAQAEHDLLA SAILLTPSLE LAEKVQVAVA 
RQLEELERAE IAAQALTNRS GIVLVPSLEV AFDLSNAYGP EHLCLLVNDP WQYVGKVRNA 
GGIFLGERSF EVLGDYVAGP SHIMPTGGTA RYASPVNVDH FRKVISLVGL NEKALQRLGP 
VAQRLAEAEG LTAHAAAVRR RLEQ