Gene BAS4280 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4280
Symbol
ID	2853165
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4190678
End bp	4191748
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	35%
IMG OID	637507516
Product	hypothetical protein
Protein accession	YP_030528
Protein GI	49187276
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.000498286
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGTAGAGA ATCAAGTGAA AAAGAAGCGT AGACGCATTT TTTTATTTTC GATTATTGCA 
CTGCTTTTAG TTTGTGGTTC AGTCTATGCG TATATTTCAT CCGCATTAGG ACCAGTTGAT 
ACCGGGAATA AAAAAGAGAT TGAAGTAGAA ATTCCAAAGG GATCATCTAC TAGTAAAATT 
GGTGAGATTT TAGAAGAAAA AGGTGCTGTG AAAAACGGTA CAGTTTTTAG TTTTTATACA 
AAGGCTAAAT CTAAAAATTT ACAAGCGGGT ACATATTTAT TAAATCCTTC AATGAGTGCG 
AAAGATGTTA TGGAGCAAAT GTCATCTGGT AATGTACATC GTCCAGCTCT TTATAAAGTG 
ACGATAAAAG AAGGAGCACA AGTAACTGAA ATTGCAGAAA CGGTTGCAAA CGAATTAAAG 
TGGAATAAAG ATGATGTCGT ACGTCAATTA AACGATAAAG CATTTATTCA AAAAATGCAG 
CAAAAGTATC CGAAGTTGTT AACCGATAAA ATCTTTGATA GCAATATTAA ATATCCGTTA 
GAAGGTTATT TATATCCTGC GACGTACTCT TTCTATAAAA AAGATACGAC GTTAGAAGAA 
GTTGTAATTC CAATGCTTGA AAAAACGAAT GCAATCATTG TTCAAAACGA GGCAAAAATG 
AAAGCGAAAA ACTGGGATGT TCACCAGCTT TTAACATTGT CTTCACTTAT TGAAGAAGAG 
GCAACAGGCT TTACAGATCG TCAAAAGATC TCTAGTGTCT TTTATAATCG TTTAGCAAAA 
GGCATGCCAC TGCAAACTGA TCCGACGGTA TTATATGCAC TTGGAAAGCA TAAACAACTT 
GTGTTATACG AAGATTTAAA GGTTAACTCA CCATACAATA CGTATGTGGT GAAAGGATTG 
CCTGTCGGTC CGATTGCAAA CTCTGGCAAA CATTCAGTGG AAGCGGCGTT AGAACCCGCG 
CAAACAGATT ATTATTATTT CTTAGCTGCA CCAACTGGTG AAGTGTATTA TGCGAAAACA 
TTGGAAGAGC ATAATGCATT AAAGCAAAAA TATATTACGA AAAAGCAGTG A

Protein sequence

MVENQVKKKR RRIFLFSIIA LLLVCGSVYA YISSALGPVD TGNKKEIEVE IPKGSSTSKI 
GEILEEKGAV KNGTVFSFYT KAKSKNLQAG TYLLNPSMSA KDVMEQMSSG NVHRPALYKV 
TIKEGAQVTE IAETVANELK WNKDDVVRQL NDKAFIQKMQ QKYPKLLTDK IFDSNIKYPL 
EGYLYPATYS FYKKDTTLEE VVIPMLEKTN AIIVQNEAKM KAKNWDVHQL LTLSSLIEEE 
ATGFTDRQKI SSVFYNRLAK GMPLQTDPTV LYALGKHKQL VLYEDLKVNS PYNTYVVKGL 
PVGPIANSGK HSVEAALEPA QTDYYYFLAA PTGEVYYAKT LEEHNALKQK YITKKQ