Gene BAS4886 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4886
Symbol
ID	2849701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4768821
End bp	4770137
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	37%
IMG OID	637508143
Product	amino acid permease family protein
Protein accession	YP_031128
Protein GI	49187875
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000145673
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATCATG ATGAGAAGAA CAAAATTGGT TTAACGGTAG CACTTTCTAT CGTAGTAGGA 
ACGATTATTG GGTCTGGTGT GTTTATGAAA CCAGGGAGCG TATTAGATTA CTCGGGGAGT 
TCTAATATGG CGATTCTTGC TTGGGTAATT GGTGGTCTGT TAACGTTAGC AAGTGGTTTA 
ACAGTAGCTG AAATTGGAGC GCAAATCCCG AAAAATGGTG GGTTGTATAC GTATTTAGAG 
GAGATTTACG GAAGTTTTTG GGGATATTTA TCAGGCTGGA TGCAAACGAT TGTTTATGGG 
CCAGCTATTA TTGGAACATT AGGGTTATAC TTTAGTTCTT TAATGATTAA TTTTTTCTAT 
TTAGATAAAG TATGGAATTT ACCAATCGCA ATTGGAACAG TTGTGTTCCT TGGCGTTGTA 
AATAGTATGG GAACAAAATA CGGAGGTATC GTCCAAACGA TCACGACAAT CGGGAAGATG 
ATTCCAATCG TATTAATTGT TGTGTTAGGT TTTTGGAAAG GGAATAGCGA TATCTTTAAC 
GTAGTTGTGC CGATATCAGA AAATCAAAGT ATCGGGATGG CGATCTTAGC AACGTTATTT 
GCTTATGACG GCTGGATTTT ACTTGCTTCG ATTGGCGGAG AAATGAAGAA TCCAACAAAG 
CTATTACCGA AAGCAATGAC AGTTGGGATT TTAATTGTAA CAGCTGCTTA CGTATTAATT 
AACTTAGCGT TACTGAATGT ATTACCAGCA ACGCAAATTG TAGAACTTGG AGAAAATGCA 
ACAGCGACAG CTGCGGGCAT GCTACTTGGG GAATATGGCG GGAAAATTAT TAGTATCGGT 
ATTATCGTAT CTATTTTCGG TTGTTTAAAT GGAAAGATTT TAACGTTCCC ACGTATCCCG 
ATGTCGATGG CAGAACGTGG ACAACTTCCA TTTGCTAAGT TTATTGCAAA GGAAAGTCCA 
AGATTTAAAA CACCAGCAAA TGCGATTACT GTTGAAATCA TTTTAGGAAT TATTTTAATG 
ATTATTAGTG ATCCAAATAA GCTATCTGAG ATTTCCGTAT TCATTATTTA TATTTTCTAC 
GTAATGACGT TTATCGGTGT CTTCATTTTA AGAAAACGTA ATAAGAATAA AGAGCGTGCA 
TACAGTGTAC CGTTATTCCC AATCGTCCCA ATCGTTGCGA TTTTGGGCTC ACTCTTTGTA 
ATCGGTAGTG CGATTATTAA CGATCCACTA AGTTGTTTCT TATCAATTGG AATTGTCTTT 
ACGGGACTTC CGGTATATTG GTATTTAAAT AAGAAGAACA AAACTGAAGT GTCATAA

Protein sequence

MHHDEKNKIG LTVALSIVVG TIIGSGVFMK PGSVLDYSGS SNMAILAWVI GGLLTLASGL 
TVAEIGAQIP KNGGLYTYLE EIYGSFWGYL SGWMQTIVYG PAIIGTLGLY FSSLMINFFY 
LDKVWNLPIA IGTVVFLGVV NSMGTKYGGI VQTITTIGKM IPIVLIVVLG FWKGNSDIFN 
VVVPISENQS IGMAILATLF AYDGWILLAS IGGEMKNPTK LLPKAMTVGI LIVTAAYVLI 
NLALLNVLPA TQIVELGENA TATAAGMLLG EYGGKIISIG IIVSIFGCLN GKILTFPRIP 
MSMAERGQLP FAKFIAKESP RFKTPANAIT VEIILGIILM IISDPNKLSE ISVFIIYIFY 
VMTFIGVFIL RKRNKNKERA YSVPLFPIVP IVAILGSLFV IGSAIINDPL SCFLSIGIVF 
TGLPVYWYLN KKNKTEVS