Gene GBAA_0514 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GBAA_0514
Symbol
ID	2817679
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. 'Ames Ancestor'
Kingdom	Bacteria
Replicon accession	NC_007530
Strand	-
Start bp	509624
End bp	510754
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	38%
IMG OID	637787481
Product	chlorohydrolase family protein
Protein accession	YP_017133
Protein GI	47777827
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATAT TGCTCAAACA AGCCATGGTC TATCCTATTA CATCCCAAAA ATTTCAAGGG 
GATGTACTCG TTATAGGAGA AAAAATTGCT GAGGTCAAGC CTTTCATTCA ACCTACTCAA 
GATATGACAG TTATAGATGC ACGTGCTCTT CATCTTTTAC CTGGATTTAT TGATGTCCAT 
ACTCATCTTG GTCTCTACGA TGAAGGTACT GGTTGGGCTG GCAATGATGC AAATGAAACA 
TCTGAAGTTT CAACACCACA TATCCGTTCT TTAGACGGAA TCCACCCTTT GGATATTGCA 
TTTCAAGATG CTGTACAAAA TGGAATTACA ACTGTTCACG TTATGCCAGG AAGTCAAAAC 
ATTATTGGTG GTACGACTTG TGTAATAAAA ACAGCCGGAA CTTGTATTGA TCATATGATT 
ATTCAAGAAC CTGCTGGCTT AAAGATTGCC TTTGGCGAAA ATCCTAAAAA AGTCCATAGT 
AATGGAACAA AAGAGTCCAT TACGCGTATG GGAATTATGG GATTACTTCG GGAATCATTT 
TATGAAGCAC AACACTACGG GCATGAAGCT GATTTTCGAA TGCTTCCTAT TTTAAAAGCA 
TTACGCCGCG AAATACCCGT ACGTATCCAC GCTCACCGAG CAGATGATAT TAGTTCTGCT 
CTACGTTTTG CAACAGAGTT CAATCTCGAT TTACGTATTG AACATTGTAC AGAAGGACAC 
TTTATTATTG AGGAACTTTC GAAGCACAAT TTGAAAGTTT CAGTTGGCCC CACGCTTACA 
CGCCGTTCTA AAATTGAACT TAAAAACAAA ACATGGGATA CTTACCATAT ATTATCGAAA 
AATGGAGTGG AAGTTTCCAT CACAACAGAT CACCCCTATA CACCCATTCA ATATTTAAAT 
CTTTGTGCTG CTGTTGCTGT AAGGGAAGGA TTAGACGAAA AAACTGCACT AGAAGGAATC 
ACTATATTTC CAGCACGAAA TTTACGTTTA GAGGATAGAA TTGGAAGCAT TGAGGTCGGA 
AAAGACGCTG ATCTTGTGCT GTGGACCCAT CATCCTTTCC ATTATTTAGC CAAGCCTGTA 
CTAACTATGA TTGATGGAAA AATAATTTAC AAAAAAAATA AAAAAAACTA G

Protein sequence

MKILLKQAMV YPITSQKFQG DVLVIGEKIA EVKPFIQPTQ DMTVIDARAL HLLPGFIDVH 
THLGLYDEGT GWAGNDANET SEVSTPHIRS LDGIHPLDIA FQDAVQNGIT TVHVMPGSQN 
IIGGTTCVIK TAGTCIDHMI IQEPAGLKIA FGENPKKVHS NGTKESITRM GIMGLLRESF 
YEAQHYGHEA DFRMLPILKA LRREIPVRIH AHRADDISSA LRFATEFNLD LRIEHCTEGH 
FIIEELSKHN LKVSVGPTLT RRSKIELKNK TWDTYHILSK NGVEVSITTD HPYTPIQYLN 
LCAAVAVREG LDEKTALEGI TIFPARNLRL EDRIGSIEVG KDADLVLWTH HPFHYLAKPV 
LTMIDGKIIY KKNKKN