Gene BAS5085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS5085
Symbol
ID	2849207
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	4964330
End bp	4965541
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	37%
IMG OID	637508340
Product	NupC family nucleoside transporter
Protein accession	YP_031324
Protein GI	49188071
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1972] Nucleoside permease
TIGRFAM ID	[TIGR00804] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000501622
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCTTT TATGGGGAAT TGGCGGCGTG ATTGGAGTAT TAGCAATCGC TTTTTTACTA 
TCTTCCAACC GCAAAGCTAT TAATTGGCGC ACAATTTTAA TCGCGCTAGC ATTACAAATG 
TCATTTTCAT TTATCGTATT ACGCTGGGAT GCCGGAAAAG CAGGTTTAAA ACACGCTGCA 
GATGGCGTTC AAGGATTAAT TAATTTTTCT TACGAGGGAA TTAAGTTCGT TGCTGGGGAT 
TTAGTCAACG CAAAAGGCCC TTGGGGATTT GTTTTCTTCA TTCAAGCACT ACTTCCAATC 
GTATTTATTA GTTCATTAGT AGCAATCTTA TATCATTTCG GTATTATGCA AAGATTTGTT 
AGTGTCGTTG GTGGCGCATT AAGTAAACTT CTTGGAACTT CTAAAGCAGA AAGTTTAAAC 
TCAGTAACAA CTGTATTTTT AGGACAAACT GAAGCTCCAA TCTTAATCAA ACCTTACTTA 
GCACGTTTAA CAAATAGTGA ATTCTTCGCT ATTATGGTAA GCGGTATGAC AGCTGTTGCT 
GGATCAGTTC TTGTCGGTTA TGCAGCAATG GGTATTCCGT TAGAACACTT ATTAGCAGCA 
GCAATTATGG CAGCTCCATC AAGTTTATTA ATTGCAAAAT TAATTATGCC AGAAACAGAA 
AAAGTAGATA ATAACGTTGA ACTTTCTACA GAACGTGAAG ATGCAAACGT TATTGACGCT 
GCGGCACGTG GTGCATCTGA AGGTATGCAA CTTGTTATTA ACGTAGCAGC AATGTTAATG 
GCTTTTATCG CATTAATCGC TTTACTAAAC GGTTTATTAG GATTAATTGG CTCTCTGTTT 
GATATTAAAC TTAGTCTTGA TTTAATCTTC GGTTATTTAC TATCACCATT TGCAATTTTA 
ATCGGGGTTT CTCCTGGTGA AGCTGTACAA GCAGCAAGCT TTATCGGTCA AAAACTTGCA 
ATCAACGAAT TCGTTGCATA CGCAAACTTA GGACCACACA TGGCAGAGTT CTCTGACAAA 
ACAAATTTAA TTTTAACATT CGCAATCTGT GGATTCGCAA ACTTCTCTTC TATCGCAATT 
CAATTAGGTG TAACAGGAAC ATTGGCTCCT ACTCGCCGTA AACAAATTGC ACAATTAGGG 
ATTAAAGCAG TTATCGCTGG TACATTAGCA AACTTCTTAA ATGCAGCAGT TGCAGGTATG 
ATGTTCCTAT AA

Protein sequence

MNLLWGIGGV IGVLAIAFLL SSNRKAINWR TILIALALQM SFSFIVLRWD AGKAGLKHAA 
DGVQGLINFS YEGIKFVAGD LVNAKGPWGF VFFIQALLPI VFISSLVAIL YHFGIMQRFV 
SVVGGALSKL LGTSKAESLN SVTTVFLGQT EAPILIKPYL ARLTNSEFFA IMVSGMTAVA 
GSVLVGYAAM GIPLEHLLAA AIMAAPSSLL IAKLIMPETE KVDNNVELST EREDANVIDA 
AARGASEGMQ LVINVAAMLM AFIALIALLN GLLGLIGSLF DIKLSLDLIF GYLLSPFAIL 
IGVSPGEAVQ AASFIGQKLA INEFVAYANL GPHMAEFSDK TNLILTFAIC GFANFSSIAI 
QLGVTGTLAP TRRKQIAQLG IKAVIAGTLA NFLNAAVAGM MFL