Gene RPC_4821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4821
Symbol
ID	3973525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	5378560
End bp	5380224
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	62%
IMG OID	637927933
Product	general substrate transporter
Protein accession	YP_534662
Protein GI	90426292
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGACGA TTGCTGTTGC ACCAGCCCGT ACGGGAGGGA TGACGAAGGA CGAACGTTTC 
GTCATTCTCG CGTCATCACT CGGCACGGTA TTCGAGTGGT ATGATTTTTA CCTCTACGGT 
TCACTTGCCA GCATTATCGG CGCGCAGTTC TTCAGCGCCT ATCCGCCGGC CACCCGCGAC 
ATCTTCGCGC TGCTCGCCTT CGCCGCGGGC TTCCTGGTCC GCCCGTTCGG TGCCATCGTG 
TTCGGCCGCA TCGGCGATAT CGTCGGCCGC AAATATACCT TCCTGGTCAC CATCCTGATC 
ATGGGTCTGT CGACCTTCAT CGTCGGTCTG TTGCCCAACG CGGCGACCAT CGGCATCGCG 
GCGCCGATCA TCCTGATCGG TCTGCGGCTG TTGCAGGGCC TGGCGCTCGG CGGCGAATAC 
GGCGGGGCAG CGACCTATGT CGCCGAGCAC TCGCCGCCCG GCAAACGCGG TTACTACACC 
TCATTCATCC AGACCACGGC GACGCTCGGA CTCTTTCTCT CGCTGATCGT GATCCTGTTT 
ACCCGCACCA TTCTCGGCGA GCCGGAATTC GCAGCCTGGG GCTGGCGTAT TCCGTTCCTG 
GTGTCGGTGC TGCTGCTCGG CGTTTCGGTC TGGATCCGGC TGAAGCTGAA TGAGTCGCCG 
GTGTTCCAGA AGATGAAGGA CGAAGGCAAG AGCTCGAAAG CGCCCTTGAC CGAAGCCTTT 
GCCAACTGGG GCAACGCCAA GATCGTGCTG ATCGCCTTGA TCGGCGGCAC CATGGGCCAG 
GGCGTGGTGT GGTACACCGG CCAGTTCTAC GCGCTGTTCT TCCTGCAATC GATCCTCAAG 
GTTGACGGCT ATACCTCCAA CCTGTTGATC GCCTGGTCGC TGTTGTTCGG GACCGGCTTC 
TTCATCTTCT TCGGCTGGCT GTCGGACAAA ATCGGCCGTA AGCCGATCAT TCTGACCGGC 
TGCTTGATCG CGGCGCTGAG CTTCTTCCCG ATCTTCCGGA TGATCACCTC CAACGCCAAC 
CCGGCGTTGG AAAAGGCCAT CGAGACCGTG AAGGTCGAGG TTGTGTCCGA TCCTGCGCTG 
TGCGGCGATC TGTTCAACCC GGTCGGCACC CGCGTGTTCA CCGCGCCTTG CGACACCGCG 
CGGGCCTATC TGGCGCAGTC CTCGGTGAAG TACTCGACCG CCTACGGTCC GGCCGGCTCC 
GGCGTCAAGG TCGTCGTCAA CGGCACCGAG GTACCTTACG TCGACGCCAA GACCTCCAAT 
CCGGCGGTGC TGGCGGCGGT TCAGGGCGCC GGCTATCCGA AGGCGGGTAA CGCCGACATC 
GTCAAGATGT CGAACCCGTT CGACATCTTC AAGCCGCAGG CCGCGGCGGT GATCGGGCTG 
CTGTTCATCT TGGTGCTGTT CGTCACCATG GTGTACGGGC CGATCGCGGC GATGCTGGTC 
GAACTGTTCC CGACCAGGAT CCGCTACACC TCGATGTCGC TGCCCTATCA CATCGGCAAC 
GGCTGGTTCG GCGGCTTGCT GCCGGCGACC GCCTTCGCCA TCGTGGCCTC GACCGGCGAT 
ATCTATGCCG GCCTGTGGTA CCCGATCATC TTCGCCTTGA TCACCTTCGT CGTCGGTCTG 
ATCTTCATGC CGGAGACCAA GAACGTCGAT ATCGGTCGCA GCTAA

Protein sequence

MSTIAVAPAR TGGMTKDERF VILASSLGTV FEWYDFYLYG SLASIIGAQF FSAYPPATRD 
IFALLAFAAG FLVRPFGAIV FGRIGDIVGR KYTFLVTILI MGLSTFIVGL LPNAATIGIA 
APIILIGLRL LQGLALGGEY GGAATYVAEH SPPGKRGYYT SFIQTTATLG LFLSLIVILF 
TRTILGEPEF AAWGWRIPFL VSVLLLGVSV WIRLKLNESP VFQKMKDEGK SSKAPLTEAF 
ANWGNAKIVL IALIGGTMGQ GVVWYTGQFY ALFFLQSILK VDGYTSNLLI AWSLLFGTGF 
FIFFGWLSDK IGRKPIILTG CLIAALSFFP IFRMITSNAN PALEKAIETV KVEVVSDPAL 
CGDLFNPVGT RVFTAPCDTA RAYLAQSSVK YSTAYGPAGS GVKVVVNGTE VPYVDAKTSN 
PAVLAAVQGA GYPKAGNADI VKMSNPFDIF KPQAAAVIGL LFILVLFVTM VYGPIAAMLV 
ELFPTRIRYT SMSLPYHIGN GWFGGLLPAT AFAIVASTGD IYAGLWYPII FALITFVVGL 
IFMPETKNVD IGRS