Gene BAS3881 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS3881
Symbol
ID	2848092
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	3829314
End bp	3830573
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	41%
IMG OID	637507118
Product	branched-chain alpha-keto acid dehydrogenase subunit E2
Protein accession	YP_030131
Protein GI	49186879
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCATTTG AATTTAAACT ACCAGATATC GGTGAAGGTA TCCACGAAGG TGAAATCGTA 
AAATGGTTTA TTAAACCAGG CGACGAAGTA AACGAAGACG ACGTACTTCT TGAAGTACAA 
AATGATAAAG CAGTAGTAGA AATTCCTTCT CCTGTTAAAG GTAAAGTACT TGAAGTACTT 
GTAGAAGAAG GTACGGTTGC AGTAGTTGGA GATACATTAA TTAAATTTGA TGCTCCAGGA 
TACGAAAACC TTAAATTTAA AGGCGACGAT CATGACGAAG CTCCTAAAGC TGAAGCTACT 
CCAGCAGCAA CTGCAGAAGT AGTAAATGAG CGCGTAATCG CTATGCCATC TGTTCGTAAA 
TATGCTCGTG AAAACGGCGT AGACATTCAT AAAGTAGCTG GTTCTGGTAA GAACGGTCGT 
ATCGTAAAAG CTGACATCGA TGCATTTGCA AATGGTGGAC AAGCAGTAGC AGCAACTGAG 
GCTCCAGCAG CAGTAGAAGC TACTCCAGCA GCAGCGAAAG AAGAAGCACC AAAAGCACAA 
CCAATCCCAG CTGGTGAATA TCCAGAAACT CGTGAGAAAA TGAGTGGTAT CCGTAAAGCA 
ATTGCGAAAG CAATGGTTAA CTCTAAACAT ACAGCTCCTC ACGTAACATT AATGGATGAA 
GTAGATGTAA CTGAACTTGT TGCTCACCGT AAGAAGTTCA AAGCTGTGGC AGCTGACAAA 
GGTATTAAAT TAACTTACCT TCCATACGTT GTTAAAGCTT TAACATCTGC ATTACGTGAA 
TACCCAATGT TAAACACTTC TTTAGATGAT GCTTCTCAAG AAGTAGTTCA TAAACATTAC 
TTCAACATCG GTATCGCAGC TGATACAGAC AAAGGTCTAT TAGTACCAGT TGTTAAAGAT 
ACAGATCGCA AGTCTATCTT CACAATTTCT AACGAGATCA ATGATCTTGC TGGTAAAGCA 
CGTGAAGGTC GTTTAGCTCC TGCTGAAATG AAAGGCGCTT CTTGCACAAT TACAAACATT 
GGTTCTGCAG GTGGACAATG GTTCACTCCA GTTATCAACC ACCCAGAAGT AGCAATCCTT 
GGTATCGGCC GTATCGCTGA GAAACCAGTT GTGAAAAACG GTGAGATCGT TGCAGCTCCA 
GTATTAGCAT TATCTCTAAG CTTTGACCAT CGTTTAATTG ACGGCGCAAC TGCTCAAAAA 
GCATTAAACC AAATTAAACG TCTATTGAAT GACCCACAAT TATTAGTAAT GGAGGCGTAA

Protein sequence

MAFEFKLPDI GEGIHEGEIV KWFIKPGDEV NEDDVLLEVQ NDKAVVEIPS PVKGKVLEVL 
VEEGTVAVVG DTLIKFDAPG YENLKFKGDD HDEAPKAEAT PAATAEVVNE RVIAMPSVRK 
YARENGVDIH KVAGSGKNGR IVKADIDAFA NGGQAVAATE APAAVEATPA AAKEEAPKAQ 
PIPAGEYPET REKMSGIRKA IAKAMVNSKH TAPHVTLMDE VDVTELVAHR KKFKAVAADK 
GIKLTYLPYV VKALTSALRE YPMLNTSLDD ASQEVVHKHY FNIGIAADTD KGLLVPVVKD 
TDRKSIFTIS NEINDLAGKA REGRLAPAEM KGASCTITNI GSAGGQWFTP VINHPEVAIL 
GIGRIAEKPV VKNGEIVAAP VLALSLSFDH RLIDGATAQK ALNQIKRLLN DPQLLVMEA