Gene BAS0943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS0943
Symbol
ID	2852605
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	997476
End bp	998774
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	40%
IMG OID	637504203
Product	DNA repair exonuclease family protein
Protein accession	YP_027217
Protein GI	49183965
COG category	[L] Replication, recombination and repair
COG ID	[COG0420] DNA repair exonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACACTA GATTTACTAT TTGTAGTAAA GTACGGAAAA AGAAAGGATC GTTATTTGTG 
AAACAAGTGA AGTTTATACA TGCGGCTGAT TTGCATTTGG ATAGTCCGTT TAAAGGAATG 
GAGATGAATG TACCGCAGTC TGTTTGGGAG AGAATGAAGC AGAGTACGTT TGAATCGTTC 
GAACGTATTA TTGATAAAGC GATTCAAGAG CGCGTTGATT TCGTATTGCT AGCCGGGGAT 
TTGTATGATG CGGAGACGAG AAGTTTGAGG GCGCAAGTGT TTGTGCGCGA GCAAATGAAG 
AGACTTTCGC AGTACGATAT CCCTGTTTTT ATTATTCACG GTAACCACGA TCATTTAGGG 
GGAAGCTGGG CAGCAATTGA GTTTCCGGAA AATGTTCATG TGTTTACAGA GCCTTACGTA 
GAAGAGAAAT CATTTTATAA AAATGGTGAG TTATTAGCTT CTATTTACGG ATTTAGTTAT 
TTGCAGCAAG CGGTAACGGA TAATATGACA GCGCAATATA CGAAAATGAG TGATGCGCCT 
TTTCATATTG GCATGCTTCA CGGAAGTGTG GAAGGCGATG CAGAGCATAA TCGCTATGCA 
CCGTTTCAAA TTCGTGAGCT GAAAGAAAAG CAGTTTGATT ATTGGGCTCT TGGCCATATA 
CATAAACGTG AAATTTTATT AGAAGAGCCA TACATCATTT ATCCAGGTAA TATACAAGGA 
CGTCATCGTA AGGAAACGGG CGAGAAGGGT GCATACCTAA TTGAACTTAC GAAACAAGGA 
TCGCACTGTT CCTTTTTCCA TACGGCGGAT GTTGTGTGGG ATGAGATAGA AGTGAATATT 
GATGGACTTG AAACTGTTGA TGAACTTATG ACAAGTGTGT CAACTGCGAT GAATGAGTGC 
CGAAGAGAAG AAGAAGGTAC GCAATTAACT GTCGTATTTA CAGGACAAGG GCCACTTTCT 
CCTTATTTAC GTGATGAAAA GCGCGTAGAA GAGATTTTTC ATATTTTAGC AGCTGGTGAA 
GAGCGAAAAG ATTTCGTATA TACGATGAAG TGGAAAAATG AGACGGTTTC TTTTGCAGAA 
ATCGAGCGTT TGAAAGAAGA AAATCATTTC GTCGGTAGTG TGCTGAAGGA GTTAGAAGCT 
TTCACTAATA TGGACGGCGT GTTGCGCAGT ATTTGGACAT CTCCTATAGC GCGTAATAGT 
ATTGAATCTT TTACAGAAGA AGAGAAGAAA GAGATTCAAA AGGAAGCGGA AAATATTATT 
TTAGAACAAT TATTCCAGCA AGAGAGGGAT AAGAAATGA

Protein sequence

MDTRFTICSK VRKKKGSLFV KQVKFIHAAD LHLDSPFKGM EMNVPQSVWE RMKQSTFESF 
ERIIDKAIQE RVDFVLLAGD LYDAETRSLR AQVFVREQMK RLSQYDIPVF IIHGNHDHLG 
GSWAAIEFPE NVHVFTEPYV EEKSFYKNGE LLASIYGFSY LQQAVTDNMT AQYTKMSDAP 
FHIGMLHGSV EGDAEHNRYA PFQIRELKEK QFDYWALGHI HKREILLEEP YIIYPGNIQG 
RHRKETGEKG AYLIELTKQG SHCSFFHTAD VVWDEIEVNI DGLETVDELM TSVSTAMNEC 
RREEEGTQLT VVFTGQGPLS PYLRDEKRVE EIFHILAAGE ERKDFVYTMK WKNETVSFAE 
IERLKEENHF VGSVLKELEA FTNMDGVLRS IWTSPIARNS IESFTEEEKK EIQKEAENII 
LEQLFQQERD KK