Gene BURPS1106A_1810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1810
Symbol
ID	4901077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	1769785
End bp	1771497
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	71%
IMG OID	640135040
Product	sulfate permease family inorganic anion transporter
Protein accession	YP_001066079
Protein GI	126451659
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID	[TIGR00815] high affinity sulphate transporter 1

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.251362
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCTCC GCTCGAAGCA CATCGACGCG CCGCCGCAGC ATGCCGCGCA TTTCGCGCCG 
CTCGACGAGC CGCCCGCGCC GCGCGCCCGC CGCACCGCGC TCGACGCGCT CGCCGGGCTG 
TCGATCGCGG GCCTTCTGAT ACCCGAGGCG GTCGCCTACG CGGGGCTCGC GAACCTGCCG 
CCGCAGGCGG GGCTCATCGC GCTCGTCGTG GGGCTCGTCG TCTACGCGAT CGCGGGCAGC 
AGCCGCTTCG CGATCGTGTC GGCGACGTCG TCGTCGGCCG TCGTGCTCGC GGCGACCGTG 
ATGTCCGAGG CCGGACCGGG CGCCGCCGCG CAGTTGATGC TCGCCGCGGC GCTCGTCGCG 
ACGACGGGCA TCCTGTTCAT CCTCGCGGGC GCCGCGCGTC TCGGCGGCAT GTCGGATTTC 
ATCGCGCGGC CGGTGCTGCG CGGCTTCACG TTCGGCCTCG CACTCACGAT CGTGATCAAG 
CAGTTGCCGA AGATGCTCGA CGTGCCGATC CATCACGGCG ATACGCTGCG CGTCGCGCTC 
GACCTGCTGC TCGGCATTGC GGGCTGCAAT GTCCGCAGCG CGGCGCTCGG CGCGACCGCG 
CTGGCGATCC TGTTCGCGCT CGGCAGGCGC ACGCGCGTGC CGGCGACGCT CGTCGTGATC 
GTGCTCGGCA TCGCGGCCGG CTACTGGATC GACTGGCATC GCTACGGCAT CGCCGTCGTC 
GGTACGATCG ATCTGCAGAA TCTCGCGTTC GGCATGCCGG TGCTCGGCCG CTCCGGCTGG 
ATGCAGACGG CCGAGTTCGG CTTCGCGCTG ATGCTGATCC TGTACGCGGA ATCGTACGGG 
TCGATTCGCA ACTTCGCGCT CAAGCACGGC GACACGGTCT CGCCGAACCG CGATCTCGTC 
GCGCTCGGCT GCGCGAACCT CGTATCGGGG CTGCTGCATG GGATGCCCGT CGGCGCGGGC 
TATTCGGCGA CCTCGGCGAA CGAGGCGGCG GGCGCGCAAA CGCGTATGGC GGGCCTGTTC 
GCGGCCGCCG TGATCGCGCT GATCGCCTGG CTGCTGCTGC CGCAGCTCGC GCGCATTCCC 
GAGCCCGTGC TCGCGGCGAT CGTGATCTTC GCGGTCAGCC ATTCGCTGCA TCCGGAGGTG 
TTCCGGCCGT ACTGGACCTG GCATCGGGAC CGGATCGTCG TGATCGCCGC GCTCGCGGCG 
GTGATCGTGC TCGGCGTGCT GCACGGCCTG CTCGCCGCGA TCGGCGTGAG CCTGCTGCTC 
ACGCTGCGGC AATTGTCCGA GCCGAACGTG AGCGTGCTGG GCCGGCTGCG CGGGAGCCAC 
GATTTCGTCG ACGTGTCGAT GCACGAGGAT GCGAAGCCGA TCCCCGGCGT GCTGATCGTG 
CGGCCGGAAG CCCAGCTCTT CTTCGCGAAC GCGGAGCGCG TGCTGACCAT GGCGAGGCGC 
CTCGCGCGCG ACGCGCAGCC GCCCGTGCAC ACGGTGATGC TGAGTCTCGA GGAATCGCCC 
GACGTCGACG GCACGACGAT CGAGGCGCTG AAGACGTTCG GCGCCGAATG CGATGCGCGC 
GGCTGGCGCC TCGCGCTCGT GCGCCTGAAG CCGAACGTGC TGCGCGTGCT GCAACGCGCG 
GCGGACGGCG GGCTGCGCGC GGATGCGCTG TCGGAGCTGA GCGTCGACGA GAGCCTGCAA 
TCGCTGACGG CGGGCGAGTT GCCGCGCGCG TGA

Protein sequence

MDLRSKHIDA PPQHAAHFAP LDEPPAPRAR RTALDALAGL SIAGLLIPEA VAYAGLANLP 
PQAGLIALVV GLVVYAIAGS SRFAIVSATS SSAVVLAATV MSEAGPGAAA QLMLAAALVA 
TTGILFILAG AARLGGMSDF IARPVLRGFT FGLALTIVIK QLPKMLDVPI HHGDTLRVAL 
DLLLGIAGCN VRSAALGATA LAILFALGRR TRVPATLVVI VLGIAAGYWI DWHRYGIAVV 
GTIDLQNLAF GMPVLGRSGW MQTAEFGFAL MLILYAESYG SIRNFALKHG DTVSPNRDLV 
ALGCANLVSG LLHGMPVGAG YSATSANEAA GAQTRMAGLF AAAVIALIAW LLLPQLARIP 
EPVLAAIVIF AVSHSLHPEV FRPYWTWHRD RIVVIAALAA VIVLGVLHGL LAAIGVSLLL 
TLRQLSEPNV SVLGRLRGSH DFVDVSMHED AKPIPGVLIV RPEAQLFFAN AERVLTMARR 
LARDAQPPVH TVMLSLEESP DVDGTTIEAL KTFGAECDAR GWRLALVRLK PNVLRVLQRA 
ADGGLRADAL SELSVDESLQ SLTAGELPRA