Gene BAS3997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS3997
Symbol
ID	2850274
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	3936984
End bp	3938168
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	38%
IMG OID	637507234
Product	phosphopentomutase
Protein accession	YP_030247
Protein GI	49186995
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1015] Phosphopentomutase
TIGRFAM ID	[TIGR01696] phosphopentomutase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAAT ATAAACGTAT ATTCCTAGTC GTAATGGACT CTGTTGGAAT CGGTGAAGCA 
CCAGATGCTG AACAATTTGG TGATTTAGGA TCTGATACAA TTGGTCACAT TGCTGAACAT 
ATGAATGGAT TACACATGCC TAACATGGTG AAATTAGGTC TTGGTAACAT TCGTGAAATG 
AAAGGCATCT CTAAAGTAGA AAAACCACTT GGATATTATA CAAAAATGCA AGAGAAATCT 
ACTGGTAAAG ATACAATGAC AGGACACTGG GAAATTATGG GTCTTTACAT TGATACACCA 
TTCCAAGTGT TCCCTGAAGG ATTCCCGAAA GAATTACTTG ATGAATTAGA AGAAAAAACA 
GGTCGTAAAA TCATCGGTAA TAAACCAGCT TCTGGAACTG AAATTCTTGA TGAACTTGGT 
CAAGAACAAA TGGAAACAGG CTCTTTAATT GTTTACACTT CTGCTGATAG CGTTCTGCAA 
ATCGCAGCAC ACGAAGAAGT AGTACCGCTT GATGAGTTGT ATAAAATTTG TAAAATTGCA 
CGTGAATTAA CGTTAGATGA GAAGTACATG GTAGGTCGCG TTATTGCTCG TCCATTCGTT 
GGTGAGCCTG GAAACTTTAC ACGTACACCG AACCGTCATG ACTATGCATT AAAACCATTC 
GGCCGTACAG TAATGAATGA ATTAAAAGAT AGTGATTATG ATGTGATTGC TATCGGTAAA 
ATCTCTGACA TCTATGATGG TGAAGGCGTA ACTGAATCAC TTCGTACGAA GTCTAACATG 
GATGGAATGG ATAAGGTTGT AGATACATTA AATATGGACT TTACAGGTCT TAGCTTCTTA 
AACTTAGTTG ACTTTGATGC ACTATTTGGT CACCGTCGTG ACCCACAAGG ATATGGAGAA 
GCTCTGCAAG AATATGATGC ACGTCTTCCA GAAGTATTCG AAAAACTAAA AGAAGATGAT 
CTATTATTAA TTACAGCAGA CCACGGTAAT GACCCAGTTC ACCACGGTAC TGACCATACA 
CGTGAATATG TACCGTTATT AGCATATAGC CCAAGCATGA AAGAAGGCGG ACAAGAGTTA 
CCACTTCGTC AAACATTTGC TGATATTGGT GCAACTGTAG CAGAAAACTT CGGTGTGAAA 
ATGCCAGAAT ACGGAACAAG CTTCTTAAAC GAGCTAAAGA AATAG

Protein sequence

MNKYKRIFLV VMDSVGIGEA PDAEQFGDLG SDTIGHIAEH MNGLHMPNMV KLGLGNIREM 
KGISKVEKPL GYYTKMQEKS TGKDTMTGHW EIMGLYIDTP FQVFPEGFPK ELLDELEEKT 
GRKIIGNKPA SGTEILDELG QEQMETGSLI VYTSADSVLQ IAAHEEVVPL DELYKICKIA 
RELTLDEKYM VGRVIARPFV GEPGNFTRTP NRHDYALKPF GRTVMNELKD SDYDVIAIGK 
ISDIYDGEGV TESLRTKSNM DGMDKVVDTL NMDFTGLSFL NLVDFDALFG HRRDPQGYGE 
ALQEYDARLP EVFEKLKEDD LLLITADHGN DPVHHGTDHT REYVPLLAYS PSMKEGGQEL 
PLRQTFADIG ATVAENFGVK MPEYGTSFLN ELKK