Gene BAS5089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS5089
Symbol
ID	2849784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4968263
End bp	4969780
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	38%
IMG OID	637508344
Product	glycine betaine transporter
Protein accession	YP_031328
Protein GI	49188075
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1292] Choline-glycine betaine transporter
TIGRFAM ID	[TIGR00842] choline/carnitine/betaine transport

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGAAAC TGACAAAAAC ATTCATCGTT TCATTAACAT TATGTATTGC ATTTACACTT 
TGGGGGATTA TTCCCGAATC TATTATTGGA AAAGGTAGCC TAGGAAATGT AACAACCGCA 
ATTCAAACTG CATTAGTTAG TAAGTTTGGA TGGTCCTATA TTATTTCTGT TTCTATTATT 
TTAGGTGTGT CTATCTTTTT AATTGTTTCG AAATACGGTT CTATTCGTTT AGGTAAAGAT 
GATGACGAGC CTGATTATAG TTATATGACA TGGTTTGCTA TGTTATTTAG TGCTGGTATG 
GGTATCGGCT TAGTCTTCTG GGGCGTTGCG GAACCATTAA ACCATTTGTA TGCACCTCCG 
TTTGGAGAGA GTGCAACTGA GGAAAGTGCA CGTCTTGCAC TGCGTTTTTC ATTTTTCCAT 
TGGGGATTAC ATCCTTGGGG ACTATATGCA TTTGTAGCGC TTTGTATTGC TTACTTTACT 
TTTAGAAAAG GAAAAGCAAG TACAATTAGT GCGACAGTAG GACCGTTATT TAAAGGCGGG 
GACCATGGAC GTATTGCTCA TTTATTTGAT GTGTTAGCTG TTTTCGCGAC TGTGTTTGGT 
GTGGCAACAT CATTAGGTCT TGGTGCAAAA CAAATTGCCG GTGGTGTTAG TTATTTAACA 
TCCATCCCGA ATTCATTAAC GACTCAGTTA GTTATTATCG CAATCGTAAC AGTGTTATTT 
ATGTTATCTG CGCAAACAGG TCTTGATAAA GGAATTAAAT ATTTAAGTAA TACGAATATT 
ATTTTGGCAT TTGCACTTAT GATTATTGTA TTATTTGTGG GTCCAACAAA CTTTATTATG 
AATTACTTCA CCTCAACAAT TGGTGCTTAC ATTCAGGAAT TACCAAGCAT GAGTTTCCGA 
TTAAGTCCAT TAGATGAAGG TGGAAACCAA TGGATTCAAT CGTGGACAAT TTTCTATTGG 
GCATGGTGGA TTGCATGGTC ACCATTCGTA GGTACATTTA TTGCTCGTGT TTCACGAGGA 
CGTACCATTC GTGAGTTTGT TATCGGTGTG TTACTCGTAC CGACCGTAAT TGGTGCCCTT 
TGGTTCTCTG TTTTCGGCGG AACTGGTATT CATATGGAGC TGTTCGGTGA TGCACATATT 
TTTGAAAAAG TGAAAGAGAT GGGAACAGAA GTAGGGTTAT TCGCTATGTT TGACCAGATG 
GGAAGCTTTG GATCGGCTTT ATCTGTTCTA GCTATTCTTC TTATTTCTAC ATTCTTTATT 
ACATCTGCAG ATTCAGCGAC ATTCGTTTTA GGAATGTTAA CAACACATGG TAGTTTAAAT 
CCGCCAAACC GCATTAAAAT GATCTGGGGT ATCGTTTTAG CAGCCTTAGC TTCTATCTTA 
TTATATGTAG GTGGCTTAGA GGCCTTACAA ACGGCAGCTA TCATTGCAGC ATTCCCATTC 
GTTTTTGTTA TTTTCTTTAT GATGGCAGCC TTATTTAAAG AGTTACAAAA AGAAGGACGT 
ATGAAGCGTC ATAAATAA

Protein sequence

MRKLTKTFIV SLTLCIAFTL WGIIPESIIG KGSLGNVTTA IQTALVSKFG WSYIISVSII 
LGVSIFLIVS KYGSIRLGKD DDEPDYSYMT WFAMLFSAGM GIGLVFWGVA EPLNHLYAPP 
FGESATEESA RLALRFSFFH WGLHPWGLYA FVALCIAYFT FRKGKASTIS ATVGPLFKGG 
DHGRIAHLFD VLAVFATVFG VATSLGLGAK QIAGGVSYLT SIPNSLTTQL VIIAIVTVLF 
MLSAQTGLDK GIKYLSNTNI ILAFALMIIV LFVGPTNFIM NYFTSTIGAY IQELPSMSFR 
LSPLDEGGNQ WIQSWTIFYW AWWIAWSPFV GTFIARVSRG RTIREFVIGV LLVPTVIGAL 
WFSVFGGTGI HMELFGDAHI FEKVKEMGTE VGLFAMFDQM GSFGSALSVL AILLISTFFI 
TSADSATFVL GMLTTHGSLN PPNRIKMIWG IVLAALASIL LYVGGLEALQ TAAIIAAFPF 
VFVIFFMMAA LFKELQKEGR MKRHK