Gene BURPS1106A_1172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1172
Symbol
ID	4900541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	1152197
End bp	1153747
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	66%
IMG OID	640134402
Product	solute/sodium symporter (SSS) family protein
Protein accession	YP_001065451
Protein GI	126453342
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.422897
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCTGA CCGCGACCTT CGTCTTCGTG CTGTTCTTCG TCGGCGTGAC GATCATGGGT 
TTTCTCGCCG CGAACTGGCG GCGCGGCAAC CTCGCGCATC TCGACGAATG GGGGCTCGGC 
GGCCGGCGCT TCGGCACGGT CGTCACGTGG TTCCTGCTCG GCGGCGATCT CTACACCGCG 
TACACGTTCG TCGCCGTGCC GGCGCTCGTG TTCGGCGCGG GCGCGATGGG CTTCTTCGCG 
CTGCCGTACA CGATCCTCAT CTATCCGTTC GCGTTCGTCG TATTCCCGAA GCTCTGGAGC 
ATCGCGAAGC GTCACGGCTA CGTGACGGCC GCCGATTTCG TCAGCGCGCG CTACGGCAGC 
CGCTCGCTCG CGCTCGCCGT CGCGGTGACG GGCATCGTCG CGACGATGCC GTACATCGCG 
CTGCAGCTCG TCGGCATCGA GGTGGTGATC GGCGGGCTCG GCTTCGACAC CAAGGGCTTC 
ATCGGCGATC TGCCGCTCAT CATCGCGTTC GCGATCCTCG CCGCTTACAC GTACACGTCG 
GGGCTGCGCG CGCCCGCGAT GATCGCGATC GTCAAGGACA TCCTGATCTA CATCACGATC 
GCCGCGGCCG TGATCGTGAT TCCGGCGAAG CTGGGCGGCT TCGGGCACAT CTTCGGCGCG 
GTGCCGCCCG CGAAGCTGCT GTTGAAAGCG CCCGACGCGG CGAGCCTGAA CGGCTTCAGC 
GCGTACACGA CGCTCGCGAT CGGCTCGGCG CTCGCGCTGT TCCTGTATCC GCACTCGGTG 
ACGGCGATCC TGTCGTCGTC GTCGGGCAAC ACGATCCGCC GCAACATGGC GATGCTGCCC 
GCGTACTCGT TCGTGCTCGG CCTGCTGGCG CTGCTCGGCT ACATGGCGCT CGCATCGGGC 
GTGAAGGACA TGCCGGAATA CGCGCCGTAC TTCAAGGCGT TCGGCCCGAA TTTCGCGGTG 
CCGGCGTTGT TCCTGCATTT CTTCCCGTCG TGGTTCGTCG GCGTCGCGTT CGCCGCGATC 
GGGATCGGCG CGCTCGTGCC GGCGGCGATC ATGTCGATCG CGGCCGCGAA CCTGTACACG 
CGCAACATTC ATCGCGAGTT CGTCAACCGC AACATGACGC ACGATCAGGA AACGCACGTC 
GCGAAGCTCG TGTCGCTGAT CGTGAAGGTC GGCGCGGTCG CGTTCATTCT CGGGCTGCCG 
CTCACCTACG CGATCCAGCT GCAACTGCTC GGCGGGATCT GGATCATCCA GACGCTGCCC 
GCGATCGTGC TCGGCCTCTA TACGCGCGTG CTCGACTATC GCGGGCTGCT CGCCGGCTGG 
GCGGCGGGGC TCGTCTGCGG CACGTGGATG GCGATCTCGC TGAAGCTCGC GAGCTCGATC 
TTCACGATCC ATCTGTTCGG CCATGCGATT CCGGGCTACG CGGCCGTTTG GGCGCTGGCC 
GTGAATCTCG TCGTGTCGAT CGTGGTCAGC GTGCTGGTTC GCGCGTTCGG GATCGCGCAC 
GCGGAAGATC GCACGCGGCC GGAGGATTAT CTCGACGTCG TCGAGAGTTG A

Protein sequence

MNLTATFVFV LFFVGVTIMG FLAANWRRGN LAHLDEWGLG GRRFGTVVTW FLLGGDLYTA 
YTFVAVPALV FGAGAMGFFA LPYTILIYPF AFVVFPKLWS IAKRHGYVTA ADFVSARYGS 
RSLALAVAVT GIVATMPYIA LQLVGIEVVI GGLGFDTKGF IGDLPLIIAF AILAAYTYTS 
GLRAPAMIAI VKDILIYITI AAAVIVIPAK LGGFGHIFGA VPPAKLLLKA PDAASLNGFS 
AYTTLAIGSA LALFLYPHSV TAILSSSSGN TIRRNMAMLP AYSFVLGLLA LLGYMALASG 
VKDMPEYAPY FKAFGPNFAV PALFLHFFPS WFVGVAFAAI GIGALVPAAI MSIAAANLYT 
RNIHREFVNR NMTHDQETHV AKLVSLIVKV GAVAFILGLP LTYAIQLQLL GGIWIIQTLP 
AIVLGLYTRV LDYRGLLAGW AAGLVCGTWM AISLKLASSI FTIHLFGHAI PGYAAVWALA 
VNLVVSIVVS VLVRAFGIAH AEDRTRPEDY LDVVES