Gene GWCH70_1169 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_1169
Symbol
ID	7977645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	+
Start bp	1217834
End bp	1219081
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	47%
IMG OID	644798122
Product	aspartate kinase I
Protein accession	YP_002949295
Protein GI	239826671
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0527] Aspartokinases
TIGRFAM ID	[TIGR00656] aspartate kinase, monofunctional class [TIGR00657] aspartate kinase

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000000398967
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCA TTGTTCAGAA GTTTGGCGGC ACATCCGTCC GTGACGGACG CGGGCGTGAT 
TTTGCACGCA AGCATATTGA AAAAGCGCTT GAAGACGGCT ATAAAGTAGT TGTTGTCGTC 
TCGGCGATGG GGCGAAAAGG AGAACCGTAT GCGACGGATA CGCTCCTTAG CCTCATCGGC 
GGGGCTAACA ATTATGTCAC GAAGCGCGAA CAAGATATGC TAATGGCGTG CGGTGAAATT 
ATTTCTAGCG TTGTTTTTAC GAATCTATTA AATAAGCATG GAATAAAAGC AACTGCGTTT 
ACTGGCGCGC AAGCAGGTTT CCGAACGAAC GATGATTATA CGAATGCGAA AATTATCGAA 
ATGCGGTGCG AACGCCTGCT TAAAGCATTG AACGAATACG ATGTCGTTGT CGTTGCTGGC 
TTTCAAGGCG CGACAGAAAA TGGCGATATT ACAACGCTTG GGCGCGGCGG AAGCGATACG 
TCTGCGGCGG CGCTTGGTGC GGCGTTAAAC GCCGAATGGG TCGATATTTT TACCGATGTC 
GAAGGGGTGA TGACTGCAGA CCCGCGCATT GTCGAGAACG CCCGTCCGCT CGATGTCGTC 
ACGTATACGG AAATTTGCAA TATGGCCTAT CAAGGGGCAA AAGTGATTCA TCCACGCGCT 
GTTGAAATTG CGATGCAGGC AAAAGTGCCG TTGCGCGTTC GTTCAACGTA TTCCGATTCT 
TTAGGAACGC TTGTTACATC TGCTATTCGT TCGAAAAAAG GAAGCGATGT AAAAGAGCGG 
TTAGTCACTG GCATTACTTA TGTTTCCAAT ATTACGCAAA TTAAAGTACA GGCGAAAGAG 
GGACATTATG AATTGCAGTC CGATGTTTTT AAGGCGATGG CGAATGAAGG AATTAGTGTC 
GACTTCATTA ACATCTCGCC AAACGGTGTT GTTTATACGG TTTCTGGTGA AATGACAGAG 
CGAGCGGTCG CTGCCCTTCG CCGTATTGGT TATGAACCGA TCGTTACAAC AGGATGTGCG 
AAAGTATCTA CAGTCGGAGC AGGGATTGCT GGAGTCCCTG GAGTGACGGC AAAAATCGTT 
ACGGCTCTTT CTGAGCAAGG AATTCAAATT TTACAATCAG CCGATAGCCA TACGACCATT 
TGGGTATTAG TGAAAGAGGA AGATATGAAA AAAGCGGTGA ACGCGTTGCA TGATGCATTC 
CATCTTTCCG AGGAATCGGC GGAAGAGTAC GATTTAAAAT TGGAGTGA

Protein sequence

MKIIVQKFGG TSVRDGRGRD FARKHIEKAL EDGYKVVVVV SAMGRKGEPY ATDTLLSLIG 
GANNYVTKRE QDMLMACGEI ISSVVFTNLL NKHGIKATAF TGAQAGFRTN DDYTNAKIIE 
MRCERLLKAL NEYDVVVVAG FQGATENGDI TTLGRGGSDT SAAALGAALN AEWVDIFTDV 
EGVMTADPRI VENARPLDVV TYTEICNMAY QGAKVIHPRA VEIAMQAKVP LRVRSTYSDS 
LGTLVTSAIR SKKGSDVKER LVTGITYVSN ITQIKVQAKE GHYELQSDVF KAMANEGISV 
DFINISPNGV VYTVSGEMTE RAVAALRRIG YEPIVTTGCA KVSTVGAGIA GVPGVTAKIV 
TALSEQGIQI LQSADSHTTI WVLVKEEDMK KAVNALHDAF HLSEESAEEY DLKLE