Gene BAS4747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4747
Symbol
ID	2851456
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4629460
End bp	4630908
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	41%
IMG OID	637507981
Product	O-succinylbenzoic acid--CoA ligase
Protein accession	YP_030991
Protein GI	49187738
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID	[TIGR01923] O-succinylbenzoate-CoA ligase

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGGAGA CGATGCCAAA TTGGTTAAAG CAACGTGCAT TTTTAACACC AGATCGCACT 
GCAATTGAAA TAGAGGAAGA GAAAGTTACT TTTATGCAGC TGCATGAAAA AGTAGTATCT 
GTTTGTGAAC ACCTCACGCA TGTAGGAGTG AATCGTGGGC AAAAGGTGGC TGTTCTGATG 
AAAAATGGTA TGGAGATGAT TACAGTTATT CACGCCCTAT CTTACGTAGG TGCAGTAGCT 
GTGCTTTTAA ATACGCGTCT TTCAAGAGAA GAGCTACTTT GGCAAATGGA TGATGCTGAA 
GTGATTTGTT TAGTGACAGA TCAAGATTTT GAGGCTAAAG ATATTCCTGT CTATTCATTC 
GCCGAAGTGA TGAATGGACC AAAAGAGGAA GCCTCTATAC AAGAAGAATT CTCTTTAAGA 
GAAGCGATGA CAATTATTTA TACGTCAGGT ACGACTGGAA AACCGAAAGG CGTTATTTTA 
ACGTACGGGA ATCACTGGGC AAGCGCGGTT GGTTCTTCGC TTAATTTAGG ACTTCGTGAT 
GATGATTGCT GGTTAGCTTG TATGCCGATG TTCCACGTTG GCGGGCTATC TCTTTTAATG 
AAAAATATTA TGTACGGCAT GCGCATTTTA CTCGTTCCGA AATATGATGC TGATTTTATT 
CATAAAGCAC TTCAAACGAG AGGCGTTACG ATTATTTCTG TCGTTTCTAA AATGTTAACT 
GATTTATTAG AGCGACTTGG AGAAGGAACA TATCCATCTT CTTTCCGATG TATGTTACTT 
GGCGGAGGAC CAGCGCCGAA ACCGTTATTA GAAACGTGTG TAGATAAAGG GATTCCTGTA 
TATCAAACGT ACGGTATGAC AGAAACGTCT TCGCAAATTT GTACGTTATC CGCGGATTAC 
ATGTTAACGA AAGTAGGATC AGCCGGCAAA CCACTATTTC AATGCCAACT TCGTATTGAA 
AAAGACGGCG TAGTAGTGCC GCCGTTTGCA GAAGGCGAGA TTGTCGTAAA AGGACCAAAC 
GTAACAGGCG GTTACTTTAA CCGTGAAGAT GCAACGCGCG AGACTATTCA AAACGGATGG 
CTTCATACTG GCGACCTCGG TTATTTAGAT GAAGAAGGAT TTTTATACGT ATTAGATCGC 
CGCAGTGATT TAATTATTTC TGGCGGAGAG AATATATATC CGGCTCAAAT TGAAGAAGTG 
TTGCTTTCTC ATCCGATGGT AGCGGAAGCT GGTGTTGTCG GTATGACTGA CGATAAATGG 
GGACAAGTAC CCGCTGCTTT TGTTGTAAAA AGTGGAGAGA TAACAGAAGA AGAAATTCTT 
CATTTTTGCG AGGAGAAATT AGCGAAATAT AAAGTGCCGA AAAAAGCGTG CTTCTTAGAA 
GAATTACCAC GAAATGCTTC GAAAAAATTG TTAAGACGAG AGTTAAGACA ATTAGTGGAG 
GAGATGTAA

Protein sequence

MMETMPNWLK QRAFLTPDRT AIEIEEEKVT FMQLHEKVVS VCEHLTHVGV NRGQKVAVLM 
KNGMEMITVI HALSYVGAVA VLLNTRLSRE ELLWQMDDAE VICLVTDQDF EAKDIPVYSF 
AEVMNGPKEE ASIQEEFSLR EAMTIIYTSG TTGKPKGVIL TYGNHWASAV GSSLNLGLRD 
DDCWLACMPM FHVGGLSLLM KNIMYGMRIL LVPKYDADFI HKALQTRGVT IISVVSKMLT 
DLLERLGEGT YPSSFRCMLL GGGPAPKPLL ETCVDKGIPV YQTYGMTETS SQICTLSADY 
MLTKVGSAGK PLFQCQLRIE KDGVVVPPFA EGEIVVKGPN VTGGYFNRED ATRETIQNGW 
LHTGDLGYLD EEGFLYVLDR RSDLIISGGE NIYPAQIEEV LLSHPMVAEA GVVGMTDDKW 
GQVPAAFVVK SGEITEEEIL HFCEEKLAKY KVPKKACFLE ELPRNASKKL LRRELRQLVE 
EM