Gene BURPS1106A_0352 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0352
Symbol
ID	4901396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	324489
End bp	325529
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	71%
IMG OID	640133582
Product	sodium/bile acid symporter family protein
Protein accession	YP_001064635
Protein GI	126452084
COG category	[R] General function prediction only
COG ID	[COG0385] Predicted Na+-dependent transporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.446247
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCGTT CCCGCTTCGT TCCCGACAAC TTCACGCTCG CGCTCGTCGG CACCGTCGTG 
CTCGCGAGCT TCCTGCCGTG CCGCGGCGAG GCCGCGCACG CGTTCAACTG GGCGACCGAC 
ATCGCGGTCG GCCTGCTGTT CTTCCTGCAC GGCGCGAAGC TCTCGCGCGA AGCGATCGTC 
GCGGGCGCGA CGCACTGGCG GCTGCATGCG CTCGTGCTGC TCAGCACGTT CGCGCTGTTC 
CCGCTGCTCG GCCTGGCGCT CAAGCCCGTG CTCACGCCGC TCGTCACGCC CGCGCTGTAC 
GCCGGCGTGC TGTTTCTCTG CACGCTGCCG TCGACGGTGC AGTCGTCGAT CGCGTTCACG 
TCGATCGCCA AGGGCAACGT GCCGGCGGCC GTCTGCTCGG CGTCCGCGTC GAGCCTGCTC 
GGCATCTTCG TCACGCCGGC GCTCGTCGGC GTGATGGTGT CGACGCAGGG CACGGGCGCG 
ACGGCGTCGC CGTGGAGCAC GATCGGCGCG ATCGTGATGC AACTGCTCGT GCCGTTCGTC 
GCCGGCCAGT TGCTGCGGCC GGTGATCGGC CGCTGGATCG AGCGCAATCG CGGCGTGCTG 
CGCTTCGTCG ATCAGGGCTC GATCCTGCTC GTCGTCTACG TCGCGTTCAG CGAAGCGGTG 
AACGAGGGGC TCTGGCACCA GATCCCGCCG ACGGCGCTCG CGGGCCTCGC CGTCGTCAAC 
GTCGTGTTGC TCGCGATCGC GCTCGCGGTC ACGACGGTCG TCAGCAAGCG GCTCGGTTTC 
AACCGCGCGG ACCAGATCAC GATCATCTTC TGCGGCTCGA AGAAGAGCCT CGCGGCCGGC 
GTGCCGATGG CGAAGGTAAT CTTCGCCGCG CACGCGGTGG GCGCGGTCGT GCTGCCGCTG 
ATGCTGTTCC ATCAGATTCA GCTGATGACC TGCGCGGCGC TCGCGCAGCG CTGGGGCGCG 
CGCGACACGA GCCGCGAACG GCGGGCGGAC GCGCCCGGCG CCGGGGCGCT CGGTTCGGGC 
GCGAGCGCGG CGAAGCGCTG A

Protein sequence

MARSRFVPDN FTLALVGTVV LASFLPCRGE AAHAFNWATD IAVGLLFFLH GAKLSREAIV 
AGATHWRLHA LVLLSTFALF PLLGLALKPV LTPLVTPALY AGVLFLCTLP STVQSSIAFT 
SIAKGNVPAA VCSASASSLL GIFVTPALVG VMVSTQGTGA TASPWSTIGA IVMQLLVPFV 
AGQLLRPVIG RWIERNRGVL RFVDQGSILL VVYVAFSEAV NEGLWHQIPP TALAGLAVVN 
VVLLAIALAV TTVVSKRLGF NRADQITIIF CGSKKSLAAG VPMAKVIFAA HAVGAVVLPL 
MLFHQIQLMT CAALAQRWGA RDTSRERRAD APGAGALGSG ASAAKR