Gene BAS1429 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1429
Symbol
ID	2852692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	1455501
End bp	1456763
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	34%
IMG OID	637504685
Product	TPR domain-containing protein
Protein accession	YP_027698
Protein GI	49184446
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAGT TTGAACAAGC TGTTTCATAT ATTGAAAATG GTGAAGCGGA AAAAGGATTA 
CAATTGTTAA AAGAACAATT AAAAATTGCG AATGATGAAG AGAAGTATGA TATCGCTCGT 
TACTATCATA CACTGGGATT TACGGATGAA GCGTTATCTA TTACAGAAGA CTTACGTTTA 
TTGTATCCAG AAGAAAGTGA ATTCACTGTA TTTTTAGCAG AATTATATAT TGATCTAGAC 
AAAGAAGATG AAGCGATTGA AGTGCTTCAT GATATTCCAG AAAATGATGA TTTATATGTT 
CAATCGTTAT TACTAGTTGC GGATTTATTC CAAATGCAAG GTTTTGATGA TGTAGCAGAA 
CAAAAACTAT TAAAGGCGAA AGAAATGATG CCTGACGAAC CTGTCATTAC GTTTGGATTA 
GCAGAGTTAT ATAGTAGTAA AGGTGAAGAA CAAAAGGCAA TCACTTATTA TGAGTCGCTA 
TTATCGGAAC ATAAAGTAAT GGGTGGTGTT GTCATTGCAC TACGCCTTGG AGAAACGTTA 
AGTGCGATTG GAAATTGGGA AGAGGCGATT TCTTACTACG AAGCAGGTTT AGAAGAACAA 
AAAGATATCC ACTCATTGTT TGGATATGCC TTCACATTAT ATCAAGGTGA AGAATACCAA 
AGAGCAATTG GTGCTTGGCA AGAACTAAAA GAATTAGATC CTGAGTATGC ATCTCTTTAC 
ATGTATTTAG CGAAAAGCTA TGAAAAAGAA GGAATGCTTC AAGAAAGCTA TGAAACACTT 
CATGAAGGAA TTAAAGTAGA TGAACTTTCT GTACCATTTT ATGTAGAATT AGCGAACATT 
GCAGCGAAAT TAGGGAAAAT AGCGGAAGCA GAGGAAGTGC TTCAAAAAGC GCTTGAGTTA 
GATCCAGGAC ATTTAGGTGC AACATTAAAA TATGCATATA TCTTAAAGGA ACAAGAAAAG 
TATGAAGAGC TAATTGCCGT TGTAGAGCGT GCTATCGATA GTGGAGAACC AGATACACAA 
CTACTTTGGG ATCTTGCGTT TGCAAAAAAA CAATTAGAAA TGTATTCTGA TGCATTAAAA 
CACTATGAAA GTGCATATAC TTCTTTTAAG AATCATCCAG ACTTCTTGGA AGAGTACGGT 
TATTTCTTAT TGGAGGAAGG TATGCAAAAA GAGGCGAAAG AAGTATTTAC TCAGTTAATA 
CAACTAGACC CGACACAAAT TCATATTGAA GAATTGTTAT ATAATTTAGA GGATTTTTCA 
TAA

Protein sequence

MQKFEQAVSY IENGEAEKGL QLLKEQLKIA NDEEKYDIAR YYHTLGFTDE ALSITEDLRL 
LYPEESEFTV FLAELYIDLD KEDEAIEVLH DIPENDDLYV QSLLLVADLF QMQGFDDVAE 
QKLLKAKEMM PDEPVITFGL AELYSSKGEE QKAITYYESL LSEHKVMGGV VIALRLGETL 
SAIGNWEEAI SYYEAGLEEQ KDIHSLFGYA FTLYQGEEYQ RAIGAWQELK ELDPEYASLY 
MYLAKSYEKE GMLQESYETL HEGIKVDELS VPFYVELANI AAKLGKIAEA EEVLQKALEL 
DPGHLGATLK YAYILKEQEK YEELIAVVER AIDSGEPDTQ LLWDLAFAKK QLEMYSDALK 
HYESAYTSFK NHPDFLEEYG YFLLEEGMQK EAKEVFTQLI QLDPTQIHIE ELLYNLEDFS