Gene BAS1973 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1973
Symbol
ID	2851440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	1977846
End bp	1979060
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	36%
IMG OID	637505223
Product	hypothetical protein
Protein accession	YP_028236
Protein GI	49184984
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGCA CGCTACGAGC ACTATATCAC GTTACGAAGT TATTACTAAT CCCTTTATGC 
CTAGTGTTAA CATTTGTGTA TGCTATGCTT CAAGGAGGAT TTGTAAGTTG GTTTTTATTT 
TACAGTATGG TTCCTATTGG TCTTTATTCA CTTTTACTCC CCTTCTACGC TTTACGGGGT 
GCTGAAGTAA AAAGAATAAC AAATCAAAAC GATTATGTAG CAGGAGAACG ATTTGTAAGC 
ACGATTACAA TAAAAAGAAA ATTTCCTTTC CCCTTACTTT ATTTAGTTAT AGAAGATGAA 
CTGCCACCAC ACCTTACAAG TTGTAGACAA ACAAAGATGA ATAAAACAAT ACTCTTTCCA 
GGATTAAAAC GAAATATTTC GTTTCAATAT GCAATTGACA CAATCCCTAG AGGAGAGCAC 
ACTTTTTCAA GCGTACGAGT CAAAACTGGT GATCTATTCA GTATGATGGA GAAAGAAGTA 
ACTTTTTCAG TTCCGGATAC ATTTTTAATC TATCCTCAGT ATGTAGATAT AACGTATCAG 
CAATTGGAAA ACCATTTCGA ACAAGGAGCG CTCTCAGCAA ATATAAATTT CACAAAAGAC 
TCTACCATTT CTGTCGGTTT GAGAGACTAT AAACCTGGTG ACCGCTTTTC ATGGATTGAT 
TGGAAAGCAA CTGCAAGAAC AAACAACATC ATGACGAAAG AGTTTGAACA ACAGCGTAGC 
CATAATATTA TGATATTCAT AGACAGAACT GAGTCCCCTC TATTCGAATC AGTCGTCACA 
TTTACTGCCT CTATTGTCAG GGCTGTATTG AAGCAAAATT CACCAGCGTC ATTTGTGTCT 
GTGGGAAAAG AACGAACTTT TTTCCCTTTA GACAATGGAG ATAGTCAGTT GCAGCAAATC 
TTTTGTCATT TAGCGAAAGT ACAAGCGGAC AGTGTATTCC CGCTCTCCCA GAGTGTAGAA 
ATGGAATTAA GAAAAGTTTA TGAGCCCGTA ACAATTATAC TTGTGACAAG CGATCTTTCT 
CCCGATATTC AAAAGGCGGC TGACTATACC GCTATACAAA ATAGAAAATT ACTAGTTTTT 
ATTGTAAAAG AAAAACCAAA TCAACTCTCA CATCGAGAAC TAAGTATTTT AGAAACTCTA 
CAAAAACGAA AAATATTTGT AAATGTAGTT TATGGAAACC AGTATACAAA CGTGTTTTTT 
GAGGTGAGCA AATGA

Protein sequence

MKRTLRALYH VTKLLLIPLC LVLTFVYAML QGGFVSWFLF YSMVPIGLYS LLLPFYALRG 
AEVKRITNQN DYVAGERFVS TITIKRKFPF PLLYLVIEDE LPPHLTSCRQ TKMNKTILFP 
GLKRNISFQY AIDTIPRGEH TFSSVRVKTG DLFSMMEKEV TFSVPDTFLI YPQYVDITYQ 
QLENHFEQGA LSANINFTKD STISVGLRDY KPGDRFSWID WKATARTNNI MTKEFEQQRS 
HNIMIFIDRT ESPLFESVVT FTASIVRAVL KQNSPASFVS VGKERTFFPL DNGDSQLQQI 
FCHLAKVQAD SVFPLSQSVE MELRKVYEPV TIILVTSDLS PDIQKAADYT AIQNRKLLVF 
IVKEKPNQLS HRELSILETL QKRKIFVNVV YGNQYTNVFF EVSK