Gene BAS5217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS5217
Symbol
ID	2850700
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	5104992
End bp	5106029
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	41%
IMG OID	637508472
Product	membrane protein PfoR
Protein accession	YP_031456
Protein GI	49188203
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1299] Phosphotransferase system, fructose-specific IIC component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTATCT TGCAAGGTTT AGCACTATTA CTTGTTGTAC TTTGTCTATT TACACTTTTT 
AGTTACCGTG CTCCTTACGG CATGAAAGCA ATGGGTGCTT TAGCTAATGC AGCAATCGCA 
AGTTTTCTTA TTGAAGCATT TCACCGTTAT ATCGGTGGAG AAATGTTTCA TAATAAATTT 
TTACAATCAG TAGGAGAAGC TTCTGGTAGT ATGAGCGGTG TGGCAGCGGC AATTTTAGTC 
GCACTAGCAA TCGGTGTTTC ACCCGTATAT GCTGTTTTAA TTGGTATCGC TACTAGTGGA 
TTCGGTATTT TACCAGGATT TTTCGCTGGA TACGTTTGCG CTTTCGTCGT GAAATTTCTT 
GAAAAGAAAT TACCAGCTGG TGTAGAGTTT TTAGCAATTT TATTTATTGC TGCACCAATC 
TCACGCGGAA TGGCAATGCT TATGGATCCG CTCGTAAACG CAACGCTCGG TAAAATCGGT 
TCTATGATTT CAGTTGCAAC TACAGAAAGT CCTATCATTA TGGGTATTAT GCTTGGTGGA 
TTAATCACAG TTATTTCTAC CTCTCCACTG AGTTCTATGG CACTAACTGC AATGCTCGCA 
TTAACAGGTT TACCAATGGC AATTGGTAGT CTTGCCGTAG CAGCCTCAGC TCCAATGAAC 
TTTATTTTCT TTAAGCGACT AAAAATTTGC TCAAAAAAAG ACACAATCGC TGTAGCAATC 
GAGCCTTTAA CACAAGCCGA TGTTGTTTCA GCAAATCCAA TTCCAATTTA TGCAACAAAC 
TTCGTTGGCG GTGCACTTGC TGGTATTATT ACATCTCTGT TCCAGCTCGT TAATAACGCA 
CCAGGAACAG CATCACCAAT CCCAGGACTT CTTGTCTTAT TCGGGTTTAA TGACGTTGTA 
AAAGTAACGA TTGCCGCTGT ATTATGTGGA ATCGTTACCA CTATTGTTGG GTACATCGGA 
TCAATCTTGT TCCGTAAATA CCCAATTCGT TCTGCTGATG AAATTCGCGG CATTTCTTCG 
GAAGAGAAGG TTGCATAA

Protein sequence

MAILQGLALL LVVLCLFTLF SYRAPYGMKA MGALANAAIA SFLIEAFHRY IGGEMFHNKF 
LQSVGEASGS MSGVAAAILV ALAIGVSPVY AVLIGIATSG FGILPGFFAG YVCAFVVKFL 
EKKLPAGVEF LAILFIAAPI SRGMAMLMDP LVNATLGKIG SMISVATTES PIIMGIMLGG 
LITVISTSPL SSMALTAMLA LTGLPMAIGS LAVAASAPMN FIFFKRLKIC SKKDTIAVAI 
EPLTQADVVS ANPIPIYATN FVGGALAGII TSLFQLVNNA PGTASPIPGL LVLFGFNDVV 
KVTIAAVLCG IVTTIVGYIG SILFRKYPIR SADEIRGISS EEKVA