Gene BAS3440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS3440
Symbol
ID	2851420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	3412169
End bp	3413440
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	40%
IMG OID	637506683
Product	imidazolonepropionase
Protein accession	YP_029696
Protein GI	49186444
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID	[TIGR01224] imidazolonepropionase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGGACA CTTTACTAAT CAATATCGGT CAATTACTAA CAATGGATCA AGAAGATGGC 
TTGTTAAGAC GGGAAGCGAT GAACACGCTT CCTGTTATCG AAAATGGTGC GGTTGGAATT 
GAAAATGGTG TAATCACTTT CGTTGGAACA GCGGAAGAAG CGAAAGGATT ACAAGCGAAA 
GAGGTTATTG ATTGCGGCGG AAAAATGGTT TCTCCTGGCC TTGTTGACCC GCATACTCAT 
CTTGTATTTG GTGGATCTCG CGAAAATGAA ATCGCACTAA AATTACAAGG AGTTCCGTAC 
TTAGAAATTT TAGAACAAGG CGGAGGTATT CTTTCAACTG TAAATGCAAC GAAACAAGCG 
TCGAAAGAAG AGCTTGTTCA AAAAGCGAAA TTCCATTTAG ACCGTATGCT ATCTTTCGGA 
GTTACAACTG TAGAAGCGAA GAGTGGTTAT GGATTAGATG ATGAGACGGA ATGGAAACAA 
TTAGAGGCAA CTGCACAATT ACAAAAAGAA CATCCAATCG ATTTAGTGTC AACGTTTTTA 
GGTGCTCATG CAGTTCCGAA GGAGTACAAA GGTAGATCAA AAGAATTTTT ACAATGGATG 
TTAGACCTAC TACCAGAAAT GAAAGAGAAG CAATTAGCAG AATTCGTTGA TATTTTCTGC 
GAAACAGGTG TGTTCTCTGT CGAAGAATCA AAAGAGTTTT TATTAAAAGC GAAAGAGCTT 
GGCTTTGATG TGAAAATTCA TGCGGATGAA ATTGATCCTC TTGGTGGTGC GGAAGCAGCA 
GCTGAAATTG GTGCAGCATC AGCGGACCAT TTAGTTGGTG CTTCTGATAA AGGAATTGAA 
ATGCTTGCAA ACTCTAATAC AGTAGCCACT TTATTACCAG GAACAACCTT CTATTTAAAT 
AAAGAAAGCT TTGCTCGCGG TCGTAAAATG ATTGATGAAG GTGTTGCGGT AGCTTTAGCC 
ACAGACTTTA ACCCAGGCAG CTGCCCAACT GAAAACATTC AGCTTATTAT GAGCATCGCA 
ATGCTGAAAT TGAAAATGAC ACCAGAGGAA GTTTGGAATG CTGTAACAGT TAACTCTTCT 
TATGCTATTA ATCGAGGCGA TGTAGCTGGG AAAATTAGAG TGGGTCGTAA GGCAGATTTA 
GTTTTATGGG ATGCTTACAA TTATGCTTAC GTACCGTATC ATTACGGTGT AAGTCATGTA 
AATACAGTGT GGAAGAATGG TAATATCGCA TATACAAGAG GTGAACAATC GTGGAGCACG 
GCCACTATTT AA

Protein sequence

MLDTLLINIG QLLTMDQEDG LLRREAMNTL PVIENGAVGI ENGVITFVGT AEEAKGLQAK 
EVIDCGGKMV SPGLVDPHTH LVFGGSRENE IALKLQGVPY LEILEQGGGI LSTVNATKQA 
SKEELVQKAK FHLDRMLSFG VTTVEAKSGY GLDDETEWKQ LEATAQLQKE HPIDLVSTFL 
GAHAVPKEYK GRSKEFLQWM LDLLPEMKEK QLAEFVDIFC ETGVFSVEES KEFLLKAKEL 
GFDVKIHADE IDPLGGAEAA AEIGAASADH LVGASDKGIE MLANSNTVAT LLPGTTFYLN 
KESFARGRKM IDEGVAVALA TDFNPGSCPT ENIQLIMSIA MLKLKMTPEE VWNAVTVNSS 
YAINRGDVAG KIRVGRKADL VLWDAYNYAY VPYHYGVSHV NTVWKNGNIA YTRGEQSWST 
ATI