Gene RPD_1026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1026
Symbol
ID	4021501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1167625
End bp	1169109
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	65%
IMG OID	637961217
Product	major facilitator transporter
Protein accession	YP_568165
Protein GI	91975506
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.76492
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAGTC CGAACAGCGC CGTGATGAGA GAGCCGCCGC CGCAGGCCGT CGGTGGCCGT 
GTCATCGAAA CCGATATTCC GGCGCGATTG GACGGCCTGC TGTGGAGCGG CTTCCACACC 
CGCGTGGTGT TCGCGCTCGG CGTCACGTGG ATTCTCGACG GCCTCGAAGT CACGCTGGCA 
GGTTCGCTGT CGGGCGCGCT GAAAGCCAGC CCGCAGCTTC AGTTCTCCAA TCTCGACATC 
GGCTTCGCCA CCAGCGCCTA TCTGGCGGGC GCTGTGCTGG GCGCGATCGG GTTCGGCTGG 
CTGACCGACC GGATCGGCCG CAAGAAATTG TTCTTCATCA CGCTCGCGCT GTATCTCACC 
GCCACCGCGG CGACGGCGCT GTCGTGGGAT CTCTGGAGCT ACGCGCTGTT TCGTTTTCTC 
ACCGGGGCGG GAATCGGTGG CGAATACACG GCGATCAACT CGACGATCCA GGAGCTGATG 
CCGGCGCGCT ATCGCGGCTG GACCGATCTG GTGATCAACG GCAGCTTCTG GATCGGTGCG 
GCGATCGGTG CAATCAGCGC CATCGTGCTG CTCGATCCGG CTGTGATCGA TCCCGAACGC 
GGCTGGCGTC TGGCGTATCT GATCGGAGCG GCGCTCGGAC TGATCGTATT CGCGATGCGG 
TTCTGGATTC CCGAAAGTCC GCGCTGGCTG ATGATCCATG GCCGTCCGGA GGAAGCCGAA 
GCGATCGTCG CCGACATCGA GAAGACGGCG CGCGCAGCGC CGGAGGCCGA GCATCGCAAC 
CCGTCGAAGA TCAGGTTGCA GATGCGCAGC CACACGCCGC TGCGTGAGGT CGCCCATACG 
CTGTTCACGA CATACCGGCA GCGCTCGATC GTCGGGCTGA CGCTGATGGC GGCGCAGGCG 
TTCTTCTACA ACGCGATCTT CTTCACCTAC GCGTTGGTGC TGACCGATTT CTTCGGCATC 
CCGTCCGGCG ACGTCGGCTG GTACATCCTG CCGTTCGCGG CCGGAAACTT CCTCGGACCG 
CTGCTGCTCG GCCGGCTGTT CGACACGCTC GGACGCCGCA AGATGATCGC CTTCACCTAC 
GGCGCTTCTG GAATCCTGCT CGCCGTGTCC GGTTATCTGT TCTCGATCGG CGCCCTGAGC 
GCGCAGGGAC AGACGATCGC CTGGATGGTG ATCTTCTTCT TCGCGTCGCC GGCGGCGAGT 
GCGGCCTATC TCACCGTCAG CGAGACCTTC CCGCTGGAGG TCCGGGCGCT GGCGATCGCA 
TTGTTCTACG CATTCGGCAC CGGAATCGGC GGCGTCGCCG GCCCGGCGCT GTTCGGGGCG 
CTGATCGACA CCGGTTCGCG CACGAGCGTG TTTGCCGGCT ATCTGCTCGG CGCGAGTCTG 
ATGATGATCG CCGCTGTGGT CGGTTGGCGT TATGGTATTG CGGCTGAACG CCGGTCGCTT 
GAACACATTG CGCGGCCGCT GGCCGCCGTA GAGGAAAGCC GATGA

Protein sequence

MASPNSAVMR EPPPQAVGGR VIETDIPARL DGLLWSGFHT RVVFALGVTW ILDGLEVTLA 
GSLSGALKAS PQLQFSNLDI GFATSAYLAG AVLGAIGFGW LTDRIGRKKL FFITLALYLT 
ATAATALSWD LWSYALFRFL TGAGIGGEYT AINSTIQELM PARYRGWTDL VINGSFWIGA 
AIGAISAIVL LDPAVIDPER GWRLAYLIGA ALGLIVFAMR FWIPESPRWL MIHGRPEEAE 
AIVADIEKTA RAAPEAEHRN PSKIRLQMRS HTPLREVAHT LFTTYRQRSI VGLTLMAAQA 
FFYNAIFFTY ALVLTDFFGI PSGDVGWYIL PFAAGNFLGP LLLGRLFDTL GRRKMIAFTY 
GASGILLAVS GYLFSIGALS AQGQTIAWMV IFFFASPAAS AAYLTVSETF PLEVRALAIA 
LFYAFGTGIG GVAGPALFGA LIDTGSRTSV FAGYLLGASL MMIAAVVGWR YGIAAERRSL 
EHIARPLAAV EESR