Gene GYMC61_3156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_3156
Symbol	hisD
ID	8527044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	-
Start bp	3204237
End bp	3205511
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	60%
IMG OID
Product	histidinol dehydrogenase
Protein accession	YP_003254195
Protein GI	261420513
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCG AACGGATCCG AGGCGGCGTT TCGCTGCGGC GCACGATTGA AAGCGGAACG 
GAGGAGCAGC GGCGCGTGGT GCTGGATATC ATTTCCAACG TGCGCGCCCG CGGCGATGAA 
GCGCTGAAAG AATACACGGA ACGGTTTGAC GGCGTCAAGC TGGATTCGCT CAAGGTGACG 
GAAGAGGAAA TGAAGCGCGC GCATGCGGCG ATGGACGCGG AGATGCTGGA GATCATTCGC 
CAAGCGGCGG CGAACATTCG CGACTACCAT GAGCGGCAAA AGCGCGAATC ATGGTGGATG 
ACGAAAGAAG ACGGCACAAT TCTCGGACAA AAGGTGACGC CGCTCGATGC GGTCGGGTTG 
TACGTGCCAG GCGGGACGGC CGCTTATCCG TCGTCTGTGC TGATGAACGT TATTCCCGCA 
CAAGTGGCGG GGGTGAAACG GATTGTCATC ACCTCGCCGC CAAACAAAGA CGGCACGCTC 
CCGGCTGGGG TGCTGGCCGC CGCCTATGAA CTCGGCGTGA CGGAAATTTA CAAAGTCGGC 
GGCGCGCAGG CGATCGCCGC GCTTGCTTAC GGGACGGAAA CGATTCGGCC GGTTGACAAA 
ATTTTCGGGC CGGGCAATAT TTATGTGGCA TTGGCGAAGC GGGAAGTGTT CGGGCATGTG 
GCGATCGACA TGATCGCGGG GCCGAGCGAA ATTGTCGTGC TGGCGGATGA AACGGCCCGA 
CCGGATGAGA TTGCGGCGGA TTTGTTGTCG CAAGCCGAGC ATGACGTGCG GGCGTCGGCC 
ATTTTGGTGA CGCCGTCGAT GAAATTGGCG CTGGCGGTGG CGAGCGAAGT CGAACGGCAG 
CTTGAAACGC TGCCGCGCCG CGACATTGCC CAAGCGGCGC TTGAGAACTA CGGCGCCATT 
TACGTCACCG AGACGCTTGA GGAAGCGGTG GATGTTGTGA ACGAACTGGC GCCGGAGCAT 
TTGGAAGTGA TGACGGCAGA ACCGCTCGCG CTTTTCGGCC GGCTCCGCCA TGCGGGAGCG 
ATGTTTTTCG GCCGCTTCAG CTCCGAGCCG GTCGGCGACT ATTTCGCCGG GCCGAACCAC 
GTGCTGCCGA CGAACGGTAC GGCAAGGTTT TCAAGCGGTC TCGGCGTCGA TGAGTTTGTG 
AAAAAATCAA GCGTGATTGT TTACAGTGAA GCCGCATTGA AACAACATGG AGAAAAAATC 
GCCGCCTTTG CCCGCCTCGA GGGGCTGGAG GCGCACGCGC GCGCCATTGA GGTGCGGCTC 
GAGAAAGGGG AATGA

Protein sequence

MKIERIRGGV SLRRTIESGT EEQRRVVLDI ISNVRARGDE ALKEYTERFD GVKLDSLKVT 
EEEMKRAHAA MDAEMLEIIR QAAANIRDYH ERQKRESWWM TKEDGTILGQ KVTPLDAVGL 
YVPGGTAAYP SSVLMNVIPA QVAGVKRIVI TSPPNKDGTL PAGVLAAAYE LGVTEIYKVG 
GAQAIAALAY GTETIRPVDK IFGPGNIYVA LAKREVFGHV AIDMIAGPSE IVVLADETAR 
PDEIAADLLS QAEHDVRASA ILVTPSMKLA LAVASEVERQ LETLPRRDIA QAALENYGAI 
YVTETLEEAV DVVNELAPEH LEVMTAEPLA LFGRLRHAGA MFFGRFSSEP VGDYFAGPNH 
VLPTNGTARF SSGLGVDEFV KKSSVIVYSE AALKQHGEKI AAFARLEGLE AHARAIEVRL 
EKGE