Gene GWCH70_0952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_0952
Symbol
ID	7976675
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	+
Start bp	1010088
End bp	1011203
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	42%
IMG OID	644797908
Product	pyruvate dehydrogenase (acetyl-transferring) E1 component, alpha subunit
Protein accession	YP_002949081
Protein GI	239826457
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID	[TIGR03181] pyruvate dehydrogenase E1 component, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.507877
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTGCAA AAAAATCCCA ATTTAAGTTT AATTTTAAGG AACAGCTTGA AAAAATTGAG 
GAACAATTTC CGACATTTCA AATTTTAAAT GAAGAAGGGG AAGTAGTAAA CGAAGCGGCA 
ATGCCGGACT TAAGCGATGA TCAACTAAAA GAATTGATGC GCCGCATGGT ATACACACGC 
GTTCTTGACC AACGTTCTAT TTCATTAAAC CGCCAAGGGC GTTTAGGCTT TTACGCACCA 
ACGGCAGGGC AAGAAGCGAG CCAAATTGCG AGCCATTTTG CGTTAGAGAA AGAAGATTTC 
ATTTTGCCTG GATACCGTGA TGTTCCGCAA CTTATTTGGC ACGGACTTCC GCTTTATCAA 
GCGTTTTTAT TCTCACGTGG GCACTTCCAC GGCAACCAAA TTCCGGAAGG GGTAAACGCA 
TTGCCGCCAC AAATTATTAT CGGTGCCCAA TACATTCAAG CAGCAGGTGT TGCTTTAGGA 
TTGAAAAAAC GCGGCAAAAA GGCAGTAGCA ATTACATACA CAGGTGACGG CGGTACATCG 
CAAGGAGATT TCTACGAAGG AATCAACTTT GCTGGAGCAT TTAAAGCACC GGCGATTTTC 
GTTGTCCAAA ACAACCGCTT TGCTATTTCT ACTCCTGTTG AAAAACAAAC AGTAGCGAAA 
ACACTTGCTC AAAAAGCGGT GGCGGCTGGA ATTCCTGGCA TTCAAGTTGA CGGTATGGAC 
CCATTAGCCG TATATGTAGC TGTACGTGCT GCTCGCGAGC GTGCGATTAA CGGCGAAGGT 
CCAACGCTTA TTGAAACTTT ATGTTTCCGT TACGGTCCGC ATACGATGTC AGGAGACGAT 
CCTACTCGTT ATCGCACGAA AGAATTGGAA AATGAATGGG AGAAAAAAGA CCCGCTTGTT 
CGTTTCCGTA AGTTTTTAGA AAACAAAGGC TTATGGAGTG AAGAAGAAGA AAACAAAGTG 
ATTGAACAAG CAAAAGAAGA AATTAAAGAG GCGATTAAAA AAGCGGACGA AACACCAAAA 
CAAAAAGTAA CCGATTTGAT TAGCATCATG TATGAAGAGT TGCCATTTAA CTTGAAAGAA 
CAGTATGAAA TTTACAAAGA GAAGGAGTCG AAGTAA

Protein sequence

MGAKKSQFKF NFKEQLEKIE EQFPTFQILN EEGEVVNEAA MPDLSDDQLK ELMRRMVYTR 
VLDQRSISLN RQGRLGFYAP TAGQEASQIA SHFALEKEDF ILPGYRDVPQ LIWHGLPLYQ 
AFLFSRGHFH GNQIPEGVNA LPPQIIIGAQ YIQAAGVALG LKKRGKKAVA ITYTGDGGTS 
QGDFYEGINF AGAFKAPAIF VVQNNRFAIS TPVEKQTVAK TLAQKAVAAG IPGIQVDGMD 
PLAVYVAVRA ARERAINGEG PTLIETLCFR YGPHTMSGDD PTRYRTKELE NEWEKKDPLV 
RFRKFLENKG LWSEEEENKV IEQAKEEIKE AIKKADETPK QKVTDLISIM YEELPFNLKE 
QYEIYKEKES K