Gene BAS1717 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1717
Symbol
ID	2850931
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	1735056
End bp	1736729
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	41%
IMG OID	637504969
Product	dihydroxy-acid dehydratase
Protein accession	YP_027982
Protein GI	49184730
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAGTG ACATGATTAA AAAAGGTTTT GATAAAGCGC CGCATCGTAG TTTATTAAAA 
GCAACTGGTT TGAAAGATGA AGACTTTGAT AAACCGTTTA TAGCGATCTG TAATTCTTTT 
ATTGAAATTA TTCCAGGTCA TAAGCACTTA AATGAGTTTG GGAAGCTTGT TAAAGAAGCA 
GTACGTGCAG CAGGTATGGT TCCATTTGAA TTTAATACAA TTGGAGTAGA TGACGGTATT 
GCGATGGGGC ATATCGGTAT GCGCTATTCG CTTCCGAGTC GAGAAATTAT TGCAGATTCA 
GTAGAAACGG TTGTAAATGC CCATTGGTTT GATGGCATGA TTTGCATTCC AAACTGTGAC 
AAAATCACAC CCGGTATGAT GATGGCTGCA CTTCGTATTA ACATTCCAAC TGTTTTTGTT 
TCAGGTGGTC CGATGGCGGC TGGAAAAACA TCTAAAGGAG ACGTTGTTGA TTTAAGTTCT 
GTTTTCGAAG GAGTAGGGGC TTATCAATCT GGGAAAATTT CAGAAGAAGA ATTAAAGGAT 
ATTGAAGATC ATGGCTGTCC ATCTTGTGGT TCTTGTTCTG GTATGTTTAC AGCGAACTCT 
ATGAACTGTT TATGTGAAGT GTTAGGTTTA GCTCTTCCTG GTAACGGAAG TATTTTGGCT 
ATTGATCCAA GACGCGAAGA ATTAATTAAA CAAGCAGCAG AAAAATTAAA GATTTTAATT 
GAAAGAGATA TTAAACCGAG AGACATTGTA ACGGAAGAAG CAATTGATGA TGCGTTCGCG 
CTTGATATGG CAATGGGCGG TTCAACAAAT ACAGTGTTGC ATACATTGGC GCTCGCGCAA 
GAGGCTGGAT TAGATTACGA TATGAACCGT ATTGATGCCG TTTCAAGACG TGTACCACAT 
TTATGTAAAG TAAGCCCTGC TTCCAATTGG CATATGGAAG ACATTGATCG TGCAGGCGGG 
ATTAGTGCAA TTTTGAAAGA GATGAGCCGA AAAGAAGGGG TACTTCATTT AGACCGTATT 
ACTGCTACGG GGCAAACATT AAGAGAAAAT ATTGCTCATG CAGAGATTAA AGATAAGGAA 
GTGATTCATT CTCTTGAAAA TCCTCATAGT GAAGAAGGTG GATTACGTAT ATTAAAAGGA 
AACCTTGCGA AAGACGGAGC AGTTATTAAA AGCGGGGCAA CTGAAGTAAA ACGATTTGAA 
GGACCTTGTG TTATTTTTAA TTCACAAGAT GAGGCGCTTG CCGGCATTAT GCTTGGGAAG 
GTTAAGAAAG GAGATGTAGT TGTTATTCGT TATGAAGGAC CAAGAGGCGG TCCTGGTATG 
CCGGAAATGT TAGCACCAAC GTCAGCGATT GCTGGCATGG GATTAGGTGC AGATGTTGCG 
TTATTAACCG ATGGTCGTTT CTCTGGTGCT TCACGTGGTA TTTCAGTAGG TCATATTTCG 
CCAGAAGCAG CTGCGGGCGG AACGATTGCA CTTCTTGAAC AAGGGGATAT CGTTTGTATC 
GATGTTGAGG AAAGGTTGTT AGAAGTAAGA GTTAGTGACG AAGAATTAGG TAAGCGTAAA 
AAAGAATGGA AACGACCAGA ACCGAAAGTG AAAACGGGCT GGCTTGGACG TTATGCACAA 
ATGGTAACAT CGGCGAATAC AGGTGCAGTC CTAAAAATCC CGAATTTTGA TTGA

Protein sequence

MRSDMIKKGF DKAPHRSLLK ATGLKDEDFD KPFIAICNSF IEIIPGHKHL NEFGKLVKEA 
VRAAGMVPFE FNTIGVDDGI AMGHIGMRYS LPSREIIADS VETVVNAHWF DGMICIPNCD 
KITPGMMMAA LRINIPTVFV SGGPMAAGKT SKGDVVDLSS VFEGVGAYQS GKISEEELKD 
IEDHGCPSCG SCSGMFTANS MNCLCEVLGL ALPGNGSILA IDPRREELIK QAAEKLKILI 
ERDIKPRDIV TEEAIDDAFA LDMAMGGSTN TVLHTLALAQ EAGLDYDMNR IDAVSRRVPH 
LCKVSPASNW HMEDIDRAGG ISAILKEMSR KEGVLHLDRI TATGQTLREN IAHAEIKDKE 
VIHSLENPHS EEGGLRILKG NLAKDGAVIK SGATEVKRFE GPCVIFNSQD EALAGIMLGK 
VKKGDVVVIR YEGPRGGPGM PEMLAPTSAI AGMGLGADVA LLTDGRFSGA SRGISVGHIS 
PEAAAGGTIA LLEQGDIVCI DVEERLLEVR VSDEELGKRK KEWKRPEPKV KTGWLGRYAQ 
MVTSANTGAV LKIPNFD