Gene GSU3100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU3100
Symbol	hisD
ID	2688475
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	3403592
End bp	3404881
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	65%
IMG OID	637127793
Product	histidinol dehydrogenase
Protein accession	NP_954141
Protein GI	39998190
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGATTCC TCGACATCAG GGATACGAAC TTTGACGCGG AATTCGCTGC CATCCTCGCC 
CGGGGCGAGG AGACCGGCCG CGAGGTGGAG CAGGTGGTTC TCGACATCAT CGCCGATGTC 
CGTGCACGGG GAGACGAGGC GCTCCTGGAG TACACCCGGC GCTTCGACCG GCTTGAGGCC 
GACTCCGTCG CCGCCCTCCA GGTGACCGAG GACGAGATCG AGTACGCCTT TGCCAAGGTG 
AAGGACGAGG AGATTGCCGC CCTCAAGCTG GCGGTGGAGC GGGTGGCCCG CTTCCACGAG 
AAGCAGAAGC AGGAGACCTG GCTCTCCACC ACCGAGCCAG ACATCCTTCT CGGTCAGATG 
GTGACGCCCC TGGAGCGGGT CGGGATCTAC GTTCCCGGCG GCAAGGCGAG CTACCCTTCC 
AGTGTCATCA TGAATGCAGT TCCGGCCCGA GTGGCCGGCG TCGGCGAGAT CGTCATGGTG 
GCCCCTACCC CCGGCGGCGA GATCAACCCG CACGTTCTGG TGGCGGCGCG GCTTTCCGGT 
GTTGACCGGA TTTTCCGGAT GGGAGGCGCC CAGGCGGTGG CGGCCCTGGC CTATGGGACC 
GCGACGGTGC CCCGGGTGGA CAAGATCACC GGCCCGGGGA ACATCTACGT GGCCACCGCC 
AAAAAGCTCG TCTTCGGCCA GGTGGGGATC GACATGATCG CCGGACCCAG CGAGATTCTC 
GTCATCAACG ACGGGAGCGG CACCCCGGCC CACATCGCCG CCGACCTCCT TTCCCAGGCG 
GAGCACGACG AACTTGCTTC ATCCATCCTC ATCACCACCG ACCGCGGTTT CGGCGAGCAG 
GTGGCGACGG AGGTGGAGCG GCAACTGGCG CAACTCTCCC GGGAGACCAT CGCCCGCACG 
TCGTGGGAGA CCTACGGCGC GGTCATCGTG GCCGGTAGCC TGGACGAGGC CATCGCTTTC 
TCGAACCGGA TCGCCCCGGA GCACCTGGAG CTTGCTGTGG CAAATCCCTT CGAGATACTG 
CCGCGGATCA AAAACGCCGG TGCTATCTTC CTCGGCCACT TCACCCCCGA GGCGGCCGGC 
GACTACCTGG CCGGCCCGAA CCACACCCTT CCCACCGGCG GTACGGCCCG TTTCTTCTCC 
CCACTGTCGG TGGACGATTT CGTGAAGAAA TCCTCTATCG TCTACTTCAG TGCGGCGGGG 
TTGAACCGTC TGGGCCGCGA CATCGTCAGT ATTGCCGAGA TGGAGGGGCT GGAGGCCCAC 
GGCAGGTCGG TAAGCATCCG CCTGAAATAA

Protein sequence

MRFLDIRDTN FDAEFAAILA RGEETGREVE QVVLDIIADV RARGDEALLE YTRRFDRLEA 
DSVAALQVTE DEIEYAFAKV KDEEIAALKL AVERVARFHE KQKQETWLST TEPDILLGQM 
VTPLERVGIY VPGGKASYPS SVIMNAVPAR VAGVGEIVMV APTPGGEINP HVLVAARLSG 
VDRIFRMGGA QAVAALAYGT ATVPRVDKIT GPGNIYVATA KKLVFGQVGI DMIAGPSEIL 
VINDGSGTPA HIAADLLSQA EHDELASSIL ITTDRGFGEQ VATEVERQLA QLSRETIART 
SWETYGAVIV AGSLDEAIAF SNRIAPEHLE LAVANPFEIL PRIKNAGAIF LGHFTPEAAG 
DYLAGPNHTL PTGGTARFFS PLSVDDFVKK SSIVYFSAAG LNRLGRDIVS IAEMEGLEAH 
GRSVSIRLK