Gene RPD_1958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1958
Symbol
ID	4022440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	2197957
End bp	2199549
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	69%
IMG OID	637962151
Product	major facilitator transporter
Protein accession	YP_569094
Protein GI	91976435
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.452075
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATGT CCGAGCATCA AAGCCGCGAA CCTGCCGGCC GGCCCTTGTC GCCCGACGAA 
GCGGCGGCGG AACTCTCGCA CAGCTCCACG GACGTGATCG ATCTCGGCCA TGCGCCGCCG 
CTGGCGCCGT CCGCGCCGCT GACCACGGAC GAGGTCCGCA CCATCCTGTT GAGCCTGTTG 
CTGGCGATGT TCCTCGCCGC GCTCGACCAG ACCATCGTGG CGACCGCGTT GCCGACGATC 
GGGCGGCAGT TCGGCGACGT CGAGAATCTG TCCTGGGTGA TCACCGCCTA TCTGTTGTCC 
TCGACCGCGG TGGCGCCGGT GTTCGGCAGC CTCTGCGATA TCTACGGCCG CCGCGCCACG 
ATCATCGCGG CGCTCAGCCT GTTCATCGCC GGCTCGGTGA TGTGCGCGCT GGCGCCGAGC 
GTTCTGGTGC TGATCCTCGG CCGCGCGTTG CAGGGGCTCG GCGGCGGCGG GATCATGCCG 
GTGGTGCAGA CGGTGATCTC CGACGTGGTC AGCCCACGCG AGCGCGGCAA GTATCAGGCG 
TATTTCTCCG GCGTCTGGGT GGCGGCGGGA ATCGGCGGCC CGGTGCTCGG CGGGGCCTTC 
GCCGAGCATC TGCACTGGTC GATGATCTTC TGGATCAATC TGCCGCTGTC GATCGGCGCG 
CTGGCGCTGC TGCTGCCGAA GATGGCGAAG ATTCCGGTGT ATCACCGCCG TCGCAAGGTC 
GACTGGCTCG GCGGCGTGCT GCTGATGGCC TCGGCGCTGG CGGTGATGCT GGTGCTGACC 
TGGGGCGGCA CGCGGTTTTC GTGGCTGTCG CCGGTGATCC TGGCGCTCGC CGGCGGCGCG 
GTGCTGTTCG CGGCGAGCTT CATCTGGCAC GCGCTGCGCG AGCCGGAGCC GTTCCTGCCG 
CTGCAATTGA TGGGCGGCAC GGTGGTGCCG TGGGCGATGG CGGCGGGCGG CTTCGCGATG 
GGCGCGATGA TCGGGCTCAC CGTGCACATC CCGCTGTATT ACGAGGCGGT GTATCACCTC 
AGCGCCAGCG CCTCGGGTCT GGCGCTGATC CCGATCGCCG CGGTCTCGGT GTTCGGCGCG 
GCGTTCACCG GCCGCGCCAT GACGCATCTC GATCATTACA AGCGGATCGC GATCATCGGC 
ACCGGCTTCT CGGCGCTGAT GGCGGCGGCG ATCGCGCTGC TGACGCCGTT GCCGCTGTGG 
GCGTTCCTGA CGCTGCTGTC GCTGTTCTCG CTCGGCCTCG GTACGGTGTT TCCGGTCAGC 
ATGGTGTCGA TCCAGAACGC GGTGCCGCGA CCGCAGATCG GCACCGCCAC CGGCGCGATG 
AACTTCTTCC GCGCGCTGAT GTCGTCGTTC ACGGTGGCGG CGTTCACCGC GGTGCTGCTG 
ATCACGTTCG GCGGCGAGAT CCAGCTCGGC GGCGCAGAGC ATCGCCACGC GGTCGGCAGC 
GTCGCCTCCG CCGACATGGT GGCGGCGTTC CGCTGGGTGT TCGGCGCGGC GGCATTGATG 
CTGGCCGGCT CGGCGATCTG CGTCGCGATC ATGGAGGAGC GCCGGCTCGC CGGCCCGGAC 
AACACGCCGC CGCCGCTGGA GCTGGCGGAG TAG

Protein sequence

MSMSEHQSRE PAGRPLSPDE AAAELSHSST DVIDLGHAPP LAPSAPLTTD EVRTILLSLL 
LAMFLAALDQ TIVATALPTI GRQFGDVENL SWVITAYLLS STAVAPVFGS LCDIYGRRAT 
IIAALSLFIA GSVMCALAPS VLVLILGRAL QGLGGGGIMP VVQTVISDVV SPRERGKYQA 
YFSGVWVAAG IGGPVLGGAF AEHLHWSMIF WINLPLSIGA LALLLPKMAK IPVYHRRRKV 
DWLGGVLLMA SALAVMLVLT WGGTRFSWLS PVILALAGGA VLFAASFIWH ALREPEPFLP 
LQLMGGTVVP WAMAAGGFAM GAMIGLTVHI PLYYEAVYHL SASASGLALI PIAAVSVFGA 
AFTGRAMTHL DHYKRIAIIG TGFSALMAAA IALLTPLPLW AFLTLLSLFS LGLGTVFPVS 
MVSIQNAVPR PQIGTATGAM NFFRALMSSF TVAAFTAVLL ITFGGEIQLG GAEHRHAVGS 
VASADMVAAF RWVFGAAALM LAGSAICVAI MEERRLAGPD NTPPPLELAE