Gene BAS3509 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS3509
Symbol
ID	2852771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	3477839
End bp	3479050
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	36%
IMG OID	637506750
Product	hypothetical protein
Protein accession	YP_029763
Protein GI	49186511
COG category	[S] Function unknown
COG ID	[COG4695] Phage-related protein
TIGRFAM ID	[TIGR01537] phage portal protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGGGTTAT TTGATAAGAT CTTTGGTAAG AAACAGGCTC CTACTACAAC TCGTTTTGAA 
ATGATAAACG ATAATGGTGG AGGTTTTTTT GCGTGGAATG GGGATATCTA TCAAAGTGAC 
ATTATACGGG CTTGTATACG TCCTAAAGCA AAAGCAGTCG GTAAGCTGAT AGCCAAGCAT 
ATACGAGATA ACTCTACTGA ATTTAAGGTG AATCCAGATT CTTATATGAG ATTTTTACTG 
GAAGAGCCTA ATCCATTGAT GACAGGACAA ATGTTTCAAG AGAAAATGGC TGTTCAATTA 
GAGTTGAATC ATAATGCATT CGCTTATATT AAGCGTGATG ATTTTGGTTA TCCTACTGAG 
ATTTATCCTA TTCCATGTAC AACAGTTGAA GTTGTAGAAG GTGCACAGGG AGACATCTTT 
TTAAAGTTTT ATTTTAAAAA TGGTAAGCAG ATGACGATTC CGTATACAGA TATCATTCAT 
TTACGTAAAG ACTTTAATGA TAATGACTTT TTCGGAGAAC ATCCTGGTAA TGCATTAGCT 
CAGTTAATGG AGATTGTAAC AACTACTGAT CAAGGTATTG TTAAAGCTAT TAAAAATAGT 
GCAGTAGTAA AGTGGATTCT TAAGTTTAAG TCAGTATTAA AACAAGAGGA TATTGATAGT 
CAGGTAAAAA ACTTTGTGAA CAACTATTTG AATATCTCGA ATGATGGCGG AGCAGCTTCT 
TCGGATCCGA GGTATGATTT AGAACAAGTG AAACCTGAAG CGTTTGTACC AGATTCCAAG 
CAGATGCAAG AAACAGTACA ACGTATTTAT AATTTCTTTA ATACAAACGA AAAGATTATC 
CAAAGTAAAT ATAACGAAGA TGAATGGAAT GCTTATTATG AATCAGAAAT AGAGCCATTT 
GCAATGCAGC TTGCTGGAGA ATTTACCAGG AAGCTTTTTT CGCGTCGGGA AAGAGGGTTT 
GGTAACAGAA TTATCTTTGA ATCTTCTTCA CTTCAATACG CTTCTATGGG GACCAAAATG 
AATCTTGTTC AGATGGTAGA TAGAGGCTCT TTGACACCAA ATGAATGGCG AGCAATTCTT 
TCACTTGGTC CAATTGAAGG TGGAGATAAG CCAATTAGAA GGTTAGATAC AGCACTGGTT 
AAGGAAGGGA ATGTCACTGA TGAAGGAGGT GATGACAATG AACAAGACGG AAAAGAGGGA 
GCTACTGAGT AG

Protein sequence

MGLFDKIFGK KQAPTTTRFE MINDNGGGFF AWNGDIYQSD IIRACIRPKA KAVGKLIAKH 
IRDNSTEFKV NPDSYMRFLL EEPNPLMTGQ MFQEKMAVQL ELNHNAFAYI KRDDFGYPTE 
IYPIPCTTVE VVEGAQGDIF LKFYFKNGKQ MTIPYTDIIH LRKDFNDNDF FGEHPGNALA 
QLMEIVTTTD QGIVKAIKNS AVVKWILKFK SVLKQEDIDS QVKNFVNNYL NISNDGGAAS 
SDPRYDLEQV KPEAFVPDSK QMQETVQRIY NFFNTNEKII QSKYNEDEWN AYYESEIEPF 
AMQLAGEFTR KLFSRRERGF GNRIIFESSS LQYASMGTKM NLVQMVDRGS LTPNEWRAIL 
SLGPIEGGDK PIRRLDTALV KEGNVTDEGG DDNEQDGKEG ATE