Gene BAS4388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4388
Symbol
ID	2851689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4299678
End bp	4300943
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	38%
IMG OID	637507625
Product	putative deaminase
Protein accession	YP_030635
Protein GI	49187383
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTTTGAGA GGATGATGGA AATGCAAAAT GCGTATTGGT TAACGAATGT ACGATTAGAA 
ACAGGTTACA AGTTTAATAA TGAAGTAGTT ACAGGTACAG AAACAGCTTT GCATCATTTA 
CTTATACAAG ATGGAAAGAT TGAAAAGATT GTACTTGCGG ATGTACCGCT TCAAACAGAA 
TATGAAACGA AAGATGCGAA AGAATTGCTT GTGCTTCCGT CGTTTGTGGA AAATCATTTT 
CACTTGGATA AGACAAAACT TGGTGGTCCA TGGGAAGCAT GTACACCAGT AAAAAATATT 
ATTGAGAGAT TAGAGTTAGA ACAGCAGGAG TTACCGATTT TAGCTCAAAC AACTGGAGAG 
AGAGCAGAGT TATTACTAAG AAACATTTTA AATGCTGGTT CGACTCATAT TCGAACGCAT 
GTAAATATTG ATCCGTATAT CGGTCTTAAA AACTTAGAAT CTGTACGTCA AACTTTAGAG 
AATATGAAAG ATGCGTTTAC ATATGAAATC GTAGCATTCC CGCAGCATGG TTTACTTCGT 
ACAGAAGCGC ATTCTCTTAT GAGAGAAGCG ATGAAAATGG GCGCAACTTT AGTAGGTGGT 
GTAGATCCAG CTACTGTAGA TAATAATATT GAAAAATCAC TTTTTGATAT GATGGAAATC 
GCTGTAGAGG CAAATGCTGA TGTTGATTTG CATTTACATG ATGCAGGGCA TTTAGGTATT 
TATACAATTA AAAAGTTAGC TCAGTATACA GAGGAGGCTA GTTGGGACGG ACGTGTTGCA 
GTCAGTCATG CGTTTAGCCT AGGGGATGTA TCTAAAGAAG AAGGAGCAGA TATGGCAGAC 
TTATTAGCTG AAAGAGGAAT GTCTATTATT ACGACAGTAC CAATTAACAG AAATATGCCG 
CCAGTACCAT TACTGACAGA AAAGGGTGTT CCCATTTCTT TAGGTTGCGA TAGTATGTTT 
GATTCATGGG GGCCATTTGG AAATGCTGAT ATTTTTGAAA GAGTAGGGCG TTTAGCAGAA 
AAGTATCGCT GGATGGATGA GAAGTCTTTA GCTTCTTCTT TAGCGTATAT TACAGGTGGA 
AAAACGCCAT TGGATCAAGA AGGAAATCAA GTTTGGCCTA AAGTAGGAGA TAAAGCTGAT 
TTCGTCTTCT TACAAGCTAC TTGTTCAGCA GAAGCGATTG CTAGACGAGC AAAGCGACCA 
GCTGTAATGA GAGACGGAAA AATAGTAGCA GGTTCCTTGC AACATGTTCA AGGAGTATTG 
ATTTAA

Protein sequence

MFERMMEMQN AYWLTNVRLE TGYKFNNEVV TGTETALHHL LIQDGKIEKI VLADVPLQTE 
YETKDAKELL VLPSFVENHF HLDKTKLGGP WEACTPVKNI IERLELEQQE LPILAQTTGE 
RAELLLRNIL NAGSTHIRTH VNIDPYIGLK NLESVRQTLE NMKDAFTYEI VAFPQHGLLR 
TEAHSLMREA MKMGATLVGG VDPATVDNNI EKSLFDMMEI AVEANADVDL HLHDAGHLGI 
YTIKKLAQYT EEASWDGRVA VSHAFSLGDV SKEEGADMAD LLAERGMSII TTVPINRNMP 
PVPLLTEKGV PISLGCDSMF DSWGPFGNAD IFERVGRLAE KYRWMDEKSL ASSLAYITGG 
KTPLDQEGNQ VWPKVGDKAD FVFLQATCSA EAIARRAKRP AVMRDGKIVA GSLQHVQGVL 
I