Gene GWCH70_2137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_2137
Symbol
ID	7976948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	2203800
End bp	2204897
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	45%
IMG OID	644798953
Product	histidinol-phosphate aminotransferase
Protein accession	YP_002950113
Protein GI	239827489
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAATTA AAACACAGTT GCGGGGGCTT CCCCCTTATC AGCCGGGAAA ATCTATTGAA 
GAAGTAAAAC GAGAGTACGG GCTTACCGAT ATTATTAAAC TAGCATCCAA TGAAAATCCA 
TATGGTTGTT CACCTGCTGT GAAAGAGGCG GTGATGAAAC AATTAGATCA TCTTGCCATT 
TATCCCGATG GATACGCACG TCTGTTGCGC GAAAAAGTTG CCACACATTT AGGGGTCAAC 
GAAACACAGC TTATTTTCGG CAACGGGTCG GATGAAGTCG TGCAAATTAT TTGCCGCGCG 
TTTTTATCTC CGAATACAAA TACGGTGATG GCTGCGCCGA CGTTTCCACA ATATCGTCAT 
AACGCGGTGA TTGAAGGGGC GGAAATTCGT GAAATTCCGC TGGTGGATGG GCGACATGAT 
CTAGAAGCAA TGCTGAATGC AATTGATGAA CAAACGCGCG TCGTTTGGAT ATGCAACCCG 
AACAACCCGA CAGGGACGTA TGTGAACGAG CAGGAATTAA CCTCTTTCCT TGAGCGAGTT 
CCTAGCCATG TCCTTGCCGT TTTGGATGAG GCGTATTATG AATACGCAAC GGCGAATGAT 
TATCCGCAAA CCGTTCCACT TCTCCGCCAA TATGATAATT TAATGATTTT GCGTACGTTT 
TCAAAAGCAT ACGGTTTAGC AGCGCTGCGG GTTGGATACG GTATTGCCAG CGAAACGCTC 
ATTCGTGAGA TCGAACCGGC GCGCGAGCCA TTTAATACAT CAAGCGTCGC GCAGGCAGCT 
GCCATTGCTG CTTTAGATGA TCAAGCATTC ATTCGCGAAT GTGTCGAAAA AAATAAACAA 
GGGTTAGAGA CGTTTTATCG TTTTTGTGAG GAAAATGGGC TGCGCTATTA TCCGTCACAA 
GCGAACTTTA TTTTAATTGA TTTTGGTATC GAGGGAAACG AAGTGTTTCA ATATTTGCTT 
GAGCGGGGCA TCATCGTTCG CTCCGGCAAT GCGCTCGGTT TTCCGACATC GGTGCGCATT 
ACGGTTGGTT CCAAAGAGCA AAACGAACGA ATCATTCATG CATTAACGCA AATGTTGAAA 
GAAAAGCAGC TTATATAA

Protein sequence

MEIKTQLRGL PPYQPGKSIE EVKREYGLTD IIKLASNENP YGCSPAVKEA VMKQLDHLAI 
YPDGYARLLR EKVATHLGVN ETQLIFGNGS DEVVQIICRA FLSPNTNTVM AAPTFPQYRH 
NAVIEGAEIR EIPLVDGRHD LEAMLNAIDE QTRVVWICNP NNPTGTYVNE QELTSFLERV 
PSHVLAVLDE AYYEYATAND YPQTVPLLRQ YDNLMILRTF SKAYGLAALR VGYGIASETL 
IREIEPAREP FNTSSVAQAA AIAALDDQAF IRECVEKNKQ GLETFYRFCE ENGLRYYPSQ 
ANFILIDFGI EGNEVFQYLL ERGIIVRSGN ALGFPTSVRI TVGSKEQNER IIHALTQMLK 
EKQLI