Gene AFE_3041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	AFE_3041
Symbol	hisD
ID	7137196
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 23270
Kingdom	Bacteria
Replicon accession	NC_011761
Strand	+
Start bp	2731557
End bp	2732858
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	65%
IMG OID	643531392
Product	histidinol dehydrogenase
Protein accession	YP_002427408
Protein GI	218665150
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.2292
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCGTC TGGACACCAG CGACCCTGAT TTCGCCCAGC AGTTTCACGC GCTGCATGAT 
TGGGATGCCA ACCTCGATCC GCAGATCGAA GTGCGGGTAC GAGAGATCGT CACCACCGTC 
CGTGATCGGG GCGATGCGGC GCTACGCGAG TACACGGAGC GCTTTGATGG GGTGACGACG 
GCTTCCGCCG CTGAGCTGGA GATCCCCCGC AGTGCCTGGG ATGCGGCGCT CCACGGTCTG 
GAGCCCACCC AGCGAGTTGC CCTGGAAGAG GCGGCGCAAC GTATCCGCAG TTACCACGAG 
CACCAGCGCA GTGTAGGCTG GACCTTTACC GAGGCCGACG GCACGATGCT CGGACAGCGC 
ATCCTGCCCT TGGCCCGGGT GGGGATTTAC GTACCCGGCG GCAAGGCGGC TTATCCCAGC 
TCCGTGCTGA TGAATGCCAT TCCCGCGCAC GTGGCGGGCG TGAAGGAAAT CATCATGACC 
GTACCCACCC CGCAGGGGCA GGTGAATCCC TGGGTGCTGG CCGCAGCCGC CATTGCCGGG 
GTGGACCGGG TGTTCTGTAT CGGCGGTGCG CAGGCAGTGG CGGCGCTCGC CTACGGTACG 
GAGAGCGTCC CCGCGGTAGA CAAGATTGTC GGCCCCGGCA ATATCTATGT GGCTACCGCC 
AAGCGCATGG TCTTTGGCCG GGTAGGCATC GATATGATTG CCGGACCCAG CGAAATCCTC 
GTGATCAGCG ATGGCTCGGC ACCGGCGGAA TGGTTGGCCT GGGACCTGCT CTCACAGGCG 
GAGCATGATG AGATTGCCCA GAGTATTTTC ATCAGTTGGG ACGATGCCCA CATCGAGTCG 
GTGGTGAACG CGGTGGATGC CGCCCTCGAT GTGCTCGATC GCGCACCCAT CGCCCGCAAG 
AGCTGGGCAG ACCGGGGGGC GGTGATTCGT GTGCGGGACC GTGCCGAGGC CTGCGCCATT 
GCCGACCGTA TCGCGCCGGA ACATCTGGAA CTAGCGGTGC AGAATCCCGA AGACTGGCTG 
GCGGACATTC ACAATGCCGG GGCCATCTTC ATGGGCATCC ATAGTTGTGA GGCCCTCGGC 
GACTATGTGG CCGGCCCCAA CCATGTGCTG CCCACGGGGG GCAGCGCACG TTTTTCCTCG 
CCCCTCGGCG TCTATGATTT CGTCAAGCGG AGCAGCCTCA TTCACAGCAG CCCCGCCGGC 
GCCGCGCGAC TGGGACAGAT CGCCGAACGT CTCGCCCTGG GCGAGGGCCT GACCGCCCAT 
GCCCGTTCAG CAGCCTGCCG CATCCCCGAA GCCGGATCAT GA

Protein sequence

MNRLDTSDPD FAQQFHALHD WDANLDPQIE VRVREIVTTV RDRGDAALRE YTERFDGVTT 
ASAAELEIPR SAWDAALHGL EPTQRVALEE AAQRIRSYHE HQRSVGWTFT EADGTMLGQR 
ILPLARVGIY VPGGKAAYPS SVLMNAIPAH VAGVKEIIMT VPTPQGQVNP WVLAAAAIAG 
VDRVFCIGGA QAVAALAYGT ESVPAVDKIV GPGNIYVATA KRMVFGRVGI DMIAGPSEIL 
VISDGSAPAE WLAWDLLSQA EHDEIAQSIF ISWDDAHIES VVNAVDAALD VLDRAPIARK 
SWADRGAVIR VRDRAEACAI ADRIAPEHLE LAVQNPEDWL ADIHNAGAIF MGIHSCEALG 
DYVAGPNHVL PTGGSARFSS PLGVYDFVKR SSLIHSSPAG AARLGQIAER LALGEGLTAH 
ARSAACRIPE AGS