Gene BAS3521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS3521
Symbol
ID	2851817
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	3487586
End bp	3488725
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	33%
IMG OID	637506762
Product	hypothetical protein
Protein accession	YP_029775
Protein GI	49186523
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000274826
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATCAA AAATGGAAGT AACAGCTATT CAGTTTAAAA AGATGGAAGA TCCATTAGGG 
AGAAGTACAA AAAAGAAGTA TATTTGCTAT GTAAATGTAA ATGATGTACC GAAGGATATT 
CCAATGGCAA CAAATCCACG AGAGCAAAAA TTAACTAAAA GTGTCCCAAA GCAAATTGAA 
GATTCATTAC TATCTGATGA TGGTGAGTTT CATTTGAAAA ATCGTGGGAT TGTAATTTCT 
GCTAAAAAAG TAGAATATAA TACTCAAACA AAGAAAATGA CATTACTTTT TGATGATTTC 
TATGAGCATG GAAACATTGA TGGTGGACAT ACTTATAAAG TAATTTTGAA GCATCAAGGA 
AAAGGGCTTC AACAATATGT TCAATTTGAA ATCATGGTAG GTGTAGAAGA TATAATTGAA 
CCATTAGCAG CTGCTAGAAA TACATCTACA CAAGTAGATG AAAAATCTAT AGCTGAGTTA 
GAAGGGAAAT TTGCACCTAT CAAAGATTCT ATTGGAGGTA TGCCTTTCTA TAATAGGGTG 
GCATTTAAAC AAAATCAGCA TTCAGATCGA AGAGGAGTAA AGGTAATAGA TGCACGTGAG 
ATTGTAGCAA TTATGACTAT GTTTAATATA GACAGTTATG GACCAGATAC TCATCCAACT 
GCTTCGTATT CTAGTAAAGC AAAAGTACTC TCAGAGTATT TAAAGGACCA ATCTGAGTTT 
GAAAAAATGC ATAATATTGC TCCAGACATG TTTGATTTAT ATAGCAAGAT TGAAATGGAT 
TTTCCTGTTG CATATAATGC AACAGGTGGA AAATATGGGG CGAAGAAATT TTCTGGCTAT 
AAAGAGGGGA ATGTAGTAGC CAAGTTGAAG TTTGGGGACG AGCCTTTAGA ATATAAAGTA 
CCGGATGGTT TAGTGTATCC TATTTTAAGT GCTTTTAGAG CTTTAGTAAC TTTAGATGAA 
AAAACTAATA TGTATCGATG GGTTAAAGAT CCTTTTGATG TATATGAAGA GATAAGAGTG 
CAATTGGCAA GTAAAATTAT GAAATTTACA GAGTCCATTG GTAACAATCC TAATGCCGTA 
GGGAAAGATA CAAACGCCTG GGATATGATG TATATGACAG TTGAACGTTA TGTAAAATAA

Protein sequence

MKSKMEVTAI QFKKMEDPLG RSTKKKYICY VNVNDVPKDI PMATNPREQK LTKSVPKQIE 
DSLLSDDGEF HLKNRGIVIS AKKVEYNTQT KKMTLLFDDF YEHGNIDGGH TYKVILKHQG 
KGLQQYVQFE IMVGVEDIIE PLAAARNTST QVDEKSIAEL EGKFAPIKDS IGGMPFYNRV 
AFKQNQHSDR RGVKVIDARE IVAIMTMFNI DSYGPDTHPT ASYSSKAKVL SEYLKDQSEF 
EKMHNIAPDM FDLYSKIEMD FPVAYNATGG KYGAKKFSGY KEGNVVAKLK FGDEPLEYKV 
PDGLVYPILS AFRALVTLDE KTNMYRWVKD PFDVYEEIRV QLASKIMKFT ESIGNNPNAV 
GKDTNAWDMM YMTVERYVK