Gene GWCH70_2979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_2979
Symbol	hisD
ID	7977278
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	2999898
End bp	3001166
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	52%
IMG OID	644799779
Product	histidinol dehydrogenase
Protein accession	YP_002950918
Protein GI	239828294
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0128196
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAATCG AACGAGTGAC AAACCGTGTA TCATTGCGCC GTACGATTGA ATCAGGGACG 
GAAGAACAGC GCAGTAAGGT TCTGGAGATT ATTGCCGATG TGCGCGCTCG CGGTGATGAA 
GCGCTAAAAA GTTATACGGA AAAATTCGAT GGCGTCCGCC TTGATTCGCT GTGCGTGACA 
AACGAAGAAA TAGAAAGAGC GTATCAGAAC GTAAGCGCAG AAGTGCTTCG GATCATCCAA 
GAGGCGGCGG AAAACATTCG CGATTATCAT GAGCGTCAAA AGAGAGAGTC ATGGATCATG 
ACAAAAGAAG ACGGCACGAT GCTTGGTCAG AAAATAACGC CGCTTGATGC GGTTGGATTG 
TACGTTCCAG GAGGGACAGC CGCCTACCCG TCATCGGTGC TTATGAATGT CATTCCTGCC 
CAAGTGGCAG GGGTCAAACG AATTGTGATC ACCTCTCCGC CAAATAAAGA CGGAACGCTT 
CCGGCCGGCG TGTTAGTGGC GGCGAACGAA TTAGGAGTGA AAGAAATCTA TAAAGTCGGC 
GGTGCGCAGG CGATTGCCGC GCTTGCATAC GGAACGGAGA CGATTCGTCC GGTCGATAAA 
ATTTTCGGGC CAGGCAACAT TTACGTGGCG CTCGCGAAAC GCGAAGTGTT CGGGCAAGTC 
GCGATTGATA TGATTGCCGG ACCGAGCGAA ATCGTCGTGT TGGCGGATGA AACGGCAAAG 
GCGAACGAAA TTGCCGCTGA TTTGTTGTCG CAAGCCGAGC ACGATGAACG CGCTTCCGCG 
ATTCTCGTTA CTCCATCGAT GAAATTGGCG CTTGCAGTCG CACGCGAGGT CGAAAAACAG 
CTGGAGACGC TGCCGCGCAA AGCGATTGCC TCTGCGTCGC TCGAGAACTA CGGAGCCATT 
TACGTCACAG AAACGCTTGC GGAAGCGGTC GAAGTTGTGA ATGAATTAGC ACCGGAGCAT 
TTGGAAGTAA TGACAGCCGA ACCGATGCAA CTCCTTGGTC AAATCCGCCA TGCGGGAGCG 
ATTTTTTTAG GGCGCTTCAG CTCGGAGCCG GTTGGCGATT ACTTCGCCGG TCCAAACCAT 
GTGCTGCCGA CGAATGGTAC AGCCCGGTTT TCGAGCGGAT TAAGCGTGGA TGAATTTGTG 
AAAAAATCGA GCATCATTTT TTACAGCGAG CCGGCGTTAA AGCAAAACGC GGAAAAAATC 
GCGGCGTTTG CCAGACTTGA AGGGCTTGAA GCACATGCGC GCGCCGTTGA AGAACGTTTT 
AAAAAATAA

Protein sequence

MKIERVTNRV SLRRTIESGT EEQRSKVLEI IADVRARGDE ALKSYTEKFD GVRLDSLCVT 
NEEIERAYQN VSAEVLRIIQ EAAENIRDYH ERQKRESWIM TKEDGTMLGQ KITPLDAVGL 
YVPGGTAAYP SSVLMNVIPA QVAGVKRIVI TSPPNKDGTL PAGVLVAANE LGVKEIYKVG 
GAQAIAALAY GTETIRPVDK IFGPGNIYVA LAKREVFGQV AIDMIAGPSE IVVLADETAK 
ANEIAADLLS QAEHDERASA ILVTPSMKLA LAVAREVEKQ LETLPRKAIA SASLENYGAI 
YVTETLAEAV EVVNELAPEH LEVMTAEPMQ LLGQIRHAGA IFLGRFSSEP VGDYFAGPNH 
VLPTNGTARF SSGLSVDEFV KKSSIIFYSE PALKQNAEKI AAFARLEGLE AHARAVEERF 
KK