Gene BAS1002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1002
Symbol
ID	2847916
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	1054544
End bp	1055896
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	36%
IMG OID	637504261
Product	hypothetical protein
Protein accession	YP_027275
Protein GI	49184023
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00204136
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGTGC AAACAGAAAC ATACCGCGCA GCTATGAATG GAACATTAGA ACGTCATTTT 
TCAGATATGA TTGCTGTTAT ACCGACTAGA ATTACAATTG AGCAGTTAAA ACAACGGCTA 
GAAAATATCG CTACTAAAGT TGATGAGTTA AAAATTGTTT ATAGTGATGA GACAAGCCTT 
ATTGTTGAGT TACATATGGA TAATAAAGTC ATACCGTATG AACTGCATAT TGATGAAACG 
GATGATCCAG AAGAATACAA ACTATACAAT AGACAAGATT CCACAATCGT AGACCGTTCT 
TTTGAAGATG CGGCTTATGG TACTGAAATT TTCACCCGTA CGCTATTTGT AGGCGATGTA 
CTGAACTGCT TTTTCCAGCA GTTACAGTTT TTATGGAACC TTGCGCCAGA TTTGTTATTC 
GTAATTGATT CAAGTGCAGC AATGAAGGTA ATATCTAGAA ACTATATTGA ATATCACGTT 
GAAAATGAAT TATTACCTGA CATTCCTGAC TTGTACGTTA TTCATTCTGT TTATGAAGAC 
GATAAAGAAG GCGAGCCTAC GCAATATTGG TTTCATACAC ACGGCCTTTT AAGAGCGGGC 
GTAACAGAAA TAGAATTAAT TATTCCAAAT CGCATTTCTT CCTACTATGG CATTGGTGAC 
CTCTTTCAAA CATTTGCGAA TAATGCCGTT GAAAATGGGC AAGTTCCTAT GAATGAGCCT 
ATCGTTATCG CACATAGTCA GCAAGGTTCT ATACATACAG TAGCTGTGCC GTGGGAAAAA 
GGTTTATCTT ATATTGGGCA TAAAACGAGT ATGGATCAAT TATCTTCAAT TGAGGATGAA 
GAAGTGAAGC TACAACCAAT AAGTGCACAA AACACATTCT TAGGCGGGAT GGATGACCGA 
GATGAATACC ATCAATCGCC ATCTGTTCTC TTGTTCAAAT TTGATACTTC AGAAGAATAT 
ATCGAAAGCT TTTTCAAAGA ACACGAGGAA GCTACAGGGC TCATGTTCTA TAAAACAAAT 
AGTGAAACGG CTCGTATGGC TTACAATGCG AAGAATACTT TCGGGTATTT CAGCAACATT 
TTTCAAATTG AACAATCAAA TGAGGAGTTT CGTTTTCTCG CTAAGTTTGG CGTTTCCTAT 
GAAGAGGGTA AAAGCGAGCA TATGTGGTTT GAAATGCAAC ATATTACGGA AGAATTTATT 
CAAGGAATAC TCATTAATGA ACCATATTTT ATAGAAGATA TGAGTGAAGG AAATAGTTAT 
CATTTAGATT TTGATGACTT AACAGAATGG GTTATTTATG CAGGAGATGC CGTTATAAAG 
CCAAATAACT TATATATGTT TATTGGTGAA TAA

Protein sequence

MEVQTETYRA AMNGTLERHF SDMIAVIPTR ITIEQLKQRL ENIATKVDEL KIVYSDETSL 
IVELHMDNKV IPYELHIDET DDPEEYKLYN RQDSTIVDRS FEDAAYGTEI FTRTLFVGDV 
LNCFFQQLQF LWNLAPDLLF VIDSSAAMKV ISRNYIEYHV ENELLPDIPD LYVIHSVYED 
DKEGEPTQYW FHTHGLLRAG VTEIELIIPN RISSYYGIGD LFQTFANNAV ENGQVPMNEP 
IVIAHSQQGS IHTVAVPWEK GLSYIGHKTS MDQLSSIEDE EVKLQPISAQ NTFLGGMDDR 
DEYHQSPSVL LFKFDTSEEY IESFFKEHEE ATGLMFYKTN SETARMAYNA KNTFGYFSNI 
FQIEQSNEEF RFLAKFGVSY EEGKSEHMWF EMQHITEEFI QGILINEPYF IEDMSEGNSY 
HLDFDDLTEW VIYAGDAVIK PNNLYMFIGE