Gene BAS4067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4067
Symbol
ID	2851870
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	3998166
End bp	3999167
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	40%
IMG OID	637507304
Product	3-methyl-2-oxobutanoate dehydrogenase subunit alpha
Protein accession	YP_030317
Protein GI	49187065
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGAAG TAAAAGAAAA GCGCCATGAA GAGCTTGGCT TAAGTGATGA GCAAGTGTTA 
GAAATGTTCC GTACGATGTT ACTTGCACGT AAAATCGACG AACGTATGTG GTTATTAAAC 
CGTGCTGGTA AAATTCCATT CGTAATTTCT TGTCAAGGAC AAGAGGCAGC ACAAGTTGGA 
GCAGCATTTG CTCTTGATAG AGAGAAAGAT TATGCATTAC CATACTACCG TGATATGGGT 
GTTGTACTAG CGTTTGGTAT GACAGCGAAA GAACTGATGC TATCTGGTTT CGCGAAAGCT 
GGAGATCCAA ACTCTGGTGG TCGTCAAATG CCTGGTCACT TCGGTCAAAA GAAAAATCGT 
ATTGTGACAG GTTCATCTCC AGTAACAACG CAAGTACCAC ATGCAGTTGG TATTGCATTA 
GCTGGAAAAA TGGAAAAGAA AGATTTAGTA ACGTTTGTTA CATTCGGTGA AGGTTCTTCT 
AACCAAGGTG ATTTCCATGA AGGTGCAAAC TTTGCTGGCG TACACAAGTT ACCTGTTATT 
TTCATGTGTG AAAATAATAA ATACGCAATC TCTATTCCAG TTGAAAAACA ATTAGCATGT 
AAAAATGTAT CAGACCGTGC AATTGGATAC GGTATGCCTG GATATACAGT AGACGGAAAC 
GATCCGCTTG CGGTATATAA AGCTGTAAAA GAAGCAGCAG ACCGTGGCCG CCGTGGTGAA 
GGACCAACTT TAATTGAAAC AGTATCATAT CGTTTAACAG CACATTCAAG TGACGATGAT 
GATCGTGTTT ATCGTGATAA AGAAGAAGTA GAAGAAGCGA AGAAAAATGA TTCAATTGTA 
ACATTTGCTG CTTATTTAAA AGAGGTTGGC GTGTTAACTG AGGAGTCTGA AAAACAAATG 
TTAGACGAAA TTATGCATAT CGTAAACGAA GCAACAGAAT ATGCAGAAAA TGCTCCGTAT 
GCAGCACCTG AAGATGCATT GAAGCACGTA TACGCAGAAT AG

Protein sequence

MAEVKEKRHE ELGLSDEQVL EMFRTMLLAR KIDERMWLLN RAGKIPFVIS CQGQEAAQVG 
AAFALDREKD YALPYYRDMG VVLAFGMTAK ELMLSGFAKA GDPNSGGRQM PGHFGQKKNR 
IVTGSSPVTT QVPHAVGIAL AGKMEKKDLV TFVTFGEGSS NQGDFHEGAN FAGVHKLPVI 
FMCENNKYAI SIPVEKQLAC KNVSDRAIGY GMPGYTVDGN DPLAVYKAVK EAADRGRRGE 
GPTLIETVSY RLTAHSSDDD DRVYRDKEEV EEAKKNDSIV TFAAYLKEVG VLTEESEKQM 
LDEIMHIVNE ATEYAENAPY AAPEDALKHV YAE