Gene BAS5031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS5031
Symbol
ID	2852090
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4902983
End bp	4904185
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	40%
IMG OID	637508286
Product	hypothetical protein
Protein accession	YP_031270
Protein GI	49188017
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.322167
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGGTGA ATGGGTTCGT GGAGGCATGG ATTTTTGAAA TAATGCGGGC AGTTGGACGT 
TTTTTCTTAC ACCCTGCTGT CTATGTATTT TTAATAAGTA GTATCTTCGT TGGATACTTA 
CGTATGTTAC GAGAACGAAA AGATTTTTCT TTTAAAGTTT ATGATATTTG GTTTGAACTG 
CGAACAGCTT TATTTGCGGG GATTGGGTAT GGATTAGTAG TATCTATTAT TACGATTGGG 
CTCGGACTTG TCGTTTCTAA AGCGAGCTTA TGGGCCATTT TACTTTGGAC ATTACTATTT 
GGATTAACTG CTATGTACCG ATATTTATCA GCAGCTTATA CGTTTAGTAT CGCGATTGTA 
TGTGTTCTAT TATCTTCTAA GCTACCAGTT TCCTTCTTAC AGCTTGGGGA AGGTGAAGAG 
AATACAATTG TGTCCCTTGC TATTTTGCTA GGCATTATGC TCGTTGTAGA GGGCTTGTTG 
ATTTCTAAAA ATGCAGTAGG ATATTCGACG CCGAAGATTA GGAAGGGTAA GCGTGGACTA 
AAGATTGGTT TACACGAATC AAAGCGTTTA TGGATCATTC CTATTTTTAT TCTCGTACCA 
GGTGACGCAG TAACGCAGTT TATTTCATGG TGGCCTGTCG TTTCAATCGG TTCTGATACA 
TATTCCCTAT TCCTCGTTCC ATTTTTAATT GGATTTATGA GAAGGATTAG AAGTTATGAG 
CCGACGGAAG CTTTATTATT TACAGGAAGA CGTGTGTACG GATTAGCAGG ACTTGTACTC 
GTTTTAGGAA TCGCAAGTTA TTGGTGGCAC GTGCTTGCAA TTATCGCAAT GGGTGTTGCG 
ATGCTTGGAC GATTCACGAT TTCCATGCAA GAGAAAATTT CTGATGAGAC AAGACCAGCG 
TATTTCGCTG CACGTAATGA TGGACTCGTT GTATTAGATA CAATCCCGAA TACAATTGGG 
GCAGAGCTGA ATTTACTACC CGGAGAAATG ATTACGAAAG TAAATGGAGT CATTCCAAGA 
AGCGCTGAGG AATTTTATGA TGCGCTTCAA ACGAAGACGA CAGGAGCATT TTGTAAATTA 
GAAGTATTAG ATACAAATGG TGAGCTTCGC CTTGCTCAAA CGGCATTATA CGCCGGAGGA 
CATCATGAAC TAGGTATTGT ATTTGTTCAG CAGGAGCATG AGTGGGATTC GGAAGCGATG 
TAA

Protein sequence

MVVNGFVEAW IFEIMRAVGR FFLHPAVYVF LISSIFVGYL RMLRERKDFS FKVYDIWFEL 
RTALFAGIGY GLVVSIITIG LGLVVSKASL WAILLWTLLF GLTAMYRYLS AAYTFSIAIV 
CVLLSSKLPV SFLQLGEGEE NTIVSLAILL GIMLVVEGLL ISKNAVGYST PKIRKGKRGL 
KIGLHESKRL WIIPIFILVP GDAVTQFISW WPVVSIGSDT YSLFLVPFLI GFMRRIRSYE 
PTEALLFTGR RVYGLAGLVL VLGIASYWWH VLAIIAMGVA MLGRFTISMQ EKISDETRPA 
YFAARNDGLV VLDTIPNTIG AELNLLPGEM ITKVNGVIPR SAEEFYDALQ TKTTGAFCKL 
EVLDTNGELR LAQTALYAGG HHELGIVFVQ QEHEWDSEAM