Gene BAS5065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS5065
Symbol
ID	2848421
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	4939093
End bp	4940310
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	38%
IMG OID	637508320
Product	proton/glutamate symporter family protein
Protein accession	YP_031304
Protein GI	49188051
COG category	[C] Energy production and conversion
COG ID	[COG1301] Na+/H+-dicarboxylate symporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGCAT ATCGCTTTCC ACTTATTTTA TTATCTTCTA TCCTAATTGG TGGTTTCATT 
GGTTATTTCA TGGGTACCGA TGCCGTTGCT TTAAAGCCGC TTGGTGACAT TTTCTTAAAC 
TTAATGTTTA CGATTGTTGT ACCGTTAGTG TTCTTTAGCA TCGCGTCATC TATTGCTAAT 
ATGGATGGAT TAAAACGTTT CGGTAAAATT ATGTCTAGTA TGGCTGGGAC TTTCTTATTT 
ACAAGTATTT TAGCTGCTAT TTTTATGATT ATTGTCGTGA AAGTATTCCC GCCAGCACAA 
GGTGTTGTAT TAGAATTAAC ACAACCTGAC AAAGCTGAAA AAGCTGTTAG CGTTGCAGAT 
CAAATTGTTG GTATTCTAAC AGTATCTGAC TTCTCGAAGT TACTATCTCG TGAAAATATG 
TTAGCTCTTA TTTTCTTCTC TATTTTAATG GGGATTGCAA CTTCAGCAGT TGGTGAAAAA 
GGAAAACCAT TCGCTACATT CTTACAAGCT GGTGCAGAAA TTTCAATGAA AGTTGTATCT 
TTCATTATGT ACTACGCTCC AATTGGACTT GCTGCTTACT TCGCAGCATT AGTTGGTGAA 
TTCGGACCAC AACTTCTTGG AACTTACTTC CGAGCAGCAA TGGTATACTA TCCAGCGTCT 
CTCATTTACT TCTTTGTATT CTTTACGTTC TATGCATACC TTGCAGGTCG CAAGCAAGGT 
GTACAAGTAT TTTGGAAGAA CATGGTCTCT CCTACAGTTA CATCACTAGC AACTTGTAGT 
AGTGCTGCTA GTATTCCAGC GAACTTAGAA GCAACGAAGA AAATGGGTAT CTCTTCTGAT 
GTTCGTGAAA CAGTTATCCT TCTTGGATCT ACACTTCATA AAGACGGATC TGTTTTAGGC 
GGCGTATTAA AAATTGCTTT CTTATTCGGT ATTTTCAACA TGGAATTCGA AGGACCGAAA 
ACATTAGCAA TCGCACTTGT TGTTTCTCTA TTAGTAGGAA CAGTAATGGG CGCTATTCCA 
GGCGGCGGTA TGATTGGTGA AATGTTAATC GTTTCTCTAT ACGGATTCCC GCCAGAAGCA 
TTACCAATTA TTGCAGCAAT TAGTACAATC ATTGATCCTC CTGCAACAAT GTTAAACGTA 
ACAGCAGATA ACGCTTGTGC CGTAATGACA GCTCGCCTTG TAGAAGGTAA GAACTGGATC 
AAAAACAAAT TTGCTTAA

Protein sequence

MKAYRFPLIL LSSILIGGFI GYFMGTDAVA LKPLGDIFLN LMFTIVVPLV FFSIASSIAN 
MDGLKRFGKI MSSMAGTFLF TSILAAIFMI IVVKVFPPAQ GVVLELTQPD KAEKAVSVAD 
QIVGILTVSD FSKLLSRENM LALIFFSILM GIATSAVGEK GKPFATFLQA GAEISMKVVS 
FIMYYAPIGL AAYFAALVGE FGPQLLGTYF RAAMVYYPAS LIYFFVFFTF YAYLAGRKQG 
VQVFWKNMVS PTVTSLATCS SAASIPANLE ATKKMGISSD VRETVILLGS TLHKDGSVLG 
GVLKIAFLFG IFNMEFEGPK TLAIALVVSL LVGTVMGAIP GGGMIGEMLI VSLYGFPPEA 
LPIIAAISTI IDPPATMLNV TADNACAVMT ARLVEGKNWI KNKFA