Gene BAS4940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4940
Symbol
ID	2847843
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4823803
End bp	4824861
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	36%
IMG OID	637508196
Product	endonuclease/exonuclease/phosphatase family protein
Protein accession	YP_031181
Protein GI	49187928
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAGAAAT TATTAAAAAT AGTACTTATA TGTATTTTAG TAGGGGTGGG AGTGGTAGGT 
GGTTTTTTAG CGTATATGAC ACTTACTAAA GAACAGCCTG CTGATGTTAT AAGTTTGCAG 
GTGGAAAATA ATAAAGAGCG CGTATTAGCG ACAGGAAATG AATTTAAAGT TACAACATTT 
AATATTGGAT ATGCTGGATT AGATAAGGAT CAAGATTTCT TTATGGATGG GGGAAAGGGA 
TCTGGTTCAA GTAGTAAAGA GCAAACGGAA ACTAATTTAA AGAATATGCT TTCGTTTTTA 
CAAAATGAGA ATAGTGATTT TGCGCTACTA CAAGAAGTTG ATATAAAATC ACTTCGATCA 
TTTGATGTAA ATGGGCATGA ATTTTTGAAA AAAGGATTAC CTGATTATGT TTCGTCGTTC 
GGAAAGAATT ATGATACGAA ATGGGTTCCC GTTCCAATTA CAAATCCAAT GGGATATGCG 
GAGGCTGGAT TAAGTACATT TTCTAAATAT ACAGTTCAAA CAGCGAAGAG ATTCCAGCTC 
CCTGGAATGG AGCCTTGGCC GAAGCGTTTA TTCGATTTAG ATCGAGCGAT TGTTGAACAT 
TCAATCCCTG TTAATAATGG AAAGCATGTT AGACTTGTAA ACTTACATTT GTCCGCGTAC 
GATGAAGGCG GGAAAATTAG AAAACAGCAA GTAGAGTTTT TAAAAGAATA TATGAACAAG 
CATTATAAAA ATGGTGATTA CGTAATAATG GGCGGAGATT GGAATCAATT AGTTTCCGAT 
GTTCAATTAA GTGATCCAAA GTTTGTGAAG GAGCGTCCTG AGTGGCTAGT AGAGTTACCG 
AAGGACTTTA CTGATGGTGG CTTTAAATGG GCGGTAGATC CTTCTGTTAT GACGGTGAGA 
GACGATGTGA AGAAATATGT AGAAGGTGAA AACTTCGTCA CGATTATTGA TGGCTTTATC 
GTTTCACCGA ATGTTGAGAT TGTAAATGTG CAAGGAAAAG ATTTAAAGTT TGAGAATAGT 
GATCATAACC CAGTGAGTGC GGTATTTAAG TTGAAGTAA

Protein sequence

MKKLLKIVLI CILVGVGVVG GFLAYMTLTK EQPADVISLQ VENNKERVLA TGNEFKVTTF 
NIGYAGLDKD QDFFMDGGKG SGSSSKEQTE TNLKNMLSFL QNENSDFALL QEVDIKSLRS 
FDVNGHEFLK KGLPDYVSSF GKNYDTKWVP VPITNPMGYA EAGLSTFSKY TVQTAKRFQL 
PGMEPWPKRL FDLDRAIVEH SIPVNNGKHV RLVNLHLSAY DEGGKIRKQQ VEFLKEYMNK 
HYKNGDYVIM GGDWNQLVSD VQLSDPKFVK ERPEWLVELP KDFTDGGFKW AVDPSVMTVR 
DDVKKYVEGE NFVTIIDGFI VSPNVEIVNV QGKDLKFENS DHNPVSAVFK LK