Gene BAS0446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS0446
Symbol
ID	2848165
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	468024
End bp	469226
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	35%
IMG OID	637503671
Product	prophage LambdaBa04, major capsid protein
Protein accession	YP_026726
Protein GI	49183474
COG category	[R] General function prediction only
COG ID	[COG4653] Predicted phage phi-C31 gp36 major capsid-like protein
TIGRFAM ID	[TIGR01554] phage major capsid protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGACTTTA ACATGAATAA AGAGCAATTA TTAAAACGTA AATCTGAAAT CGGTGAATTA 
TTAAGTGATG AAACGCGTTC TATTGATAAT CTTGATACGA TTGAAACGGA GTTACGAGAC 
ATTAATGAAC AGTTGGCAGC AATTGAAAAA CGTGAACAAC TTTTAAATGA AGCACGTTCA 
ATTAATGAAG GGAACGCAGC TGGAGCAAAT AAAATCGAAA CATTTAATGC TAATCTTAAT 
CTATCAAATG AGAAACGTGA AATTGGTACG AATACAGTTG AATACCGTAA TGCTTTTATG 
AATTACGTAT TACGTGGTGA GGCAATTCCA GCTGAATTAC GTGCAAATGC TGTGACTAAA 
ACAAGTGACA TCGGTTCTGT TATCCCGCAA ACAGTACTAG ATAAGATTAT TGAAAAGATT 
GAAGCGGTAG GGATGATTCT ACCTTTAATT ACTCGTACAG CTATTAAAGG AGGGGTAACA 
GTACCAACCT CAGCAGTTAA ACCAGTTGCA ACATGGGTTG CTGAAAGTTC TGGAAGTGAT 
AAACAAAAGA AAACTACAGG AAGCATTACT TTCAACTATC ATAAATTACG TTGTGCTGTA 
GCTGTTTCTC TTGAAGTAGA AACAATGTCT TTAGCAGTAT TTGAAACAAC ATTAATCAAT 
AATATTGTGG AAGCTATGAC AAAAGCGATT GAACAAGCTA TTGTTAGTGG TGATGGGTCT 
GGTAAACCAA AGGGAATCCT AGCGGAAACA CCGTTTGAAG GACAAGCATT AGATGTTGCG 
AAAATCAATT ATAAAACTTT AACAGATGCA GAAGCAGCTT TACCACTTGA GTATGAAGCA 
AGTGCAATTT GGACGATGAC GAAAAAGACA TTTATGGAGT TTTCGGCAAT GACAGATGCA 
GACGGACAGC CAATTGCGCG TACAAATTAC GGAATTTCTG GTAAACCAGA ACGTATTTTA 
TTAGGTCGTC CAGTTGTTTT ATGTAATTAT GTTGATAGTT TCGCAACGGC TACTGAAGGA 
ACAGCGTTCG CATTCTTATT TAATTACAAA GATTATATTC TTAATACAAA CTACCAAATG 
GGTGTTAAGA AATATGAAGA CAATGAAACT GACGATCAAG TTACAAAAGC AATTATGATT 
GTGGATGGTA AAGTAGTAGA CAAAAATTCT TTAGTTGTTT TAAAAAAAGC TCCATCAGCT 
TAA

Protein sequence

MDFNMNKEQL LKRKSEIGEL LSDETRSIDN LDTIETELRD INEQLAAIEK REQLLNEARS 
INEGNAAGAN KIETFNANLN LSNEKREIGT NTVEYRNAFM NYVLRGEAIP AELRANAVTK 
TSDIGSVIPQ TVLDKIIEKI EAVGMILPLI TRTAIKGGVT VPTSAVKPVA TWVAESSGSD 
KQKKTTGSIT FNYHKLRCAV AVSLEVETMS LAVFETTLIN NIVEAMTKAI EQAIVSGDGS 
GKPKGILAET PFEGQALDVA KINYKTLTDA EAALPLEYEA SAIWTMTKKT FMEFSAMTDA 
DGQPIARTNY GISGKPERIL LGRPVVLCNY VDSFATATEG TAFAFLFNYK DYILNTNYQM 
GVKKYEDNET DDQVTKAIMI VDGKVVDKNS LVVLKKAPSA