Gene RPD_4227 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4227
Symbol
ID	4024748
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4694026
End bp	4695303
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	69%
IMG OID	637964433
Product	major facilitator transporter
Protein accession	YP_571345
Protein GI	91978686
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0992586
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.574471
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCCCTGC AGCAGACGCC CGGCCAGCAA CGGTCGCTCG ACGCCCTGAA CTTCTTCCTG 
GCCGACGTCC GCGACGGGCT CGGGCCCTAT CTGGCGATCT ATCTGCTGTC GGTTCAGCAC 
TGGAATGAGG CCTCGATCGG ACTGGTGATG ACGGTTGCCG CGATGGCTGG GATCGCCGCT 
CAGACGCCGG CCGGGGCGCT GATCGACCGC TCTACGGCCA AGCGCGGCCT GCTGATCGCC 
GCCGCGATCG CGGTGACGCT GGCGTCAGTA ACGCTGCCGC TGTTGCAGAG CTTCGAAGCC 
GTCGCGGCGA CCCAGGCACT TGCAGGCGCC GCCGGCGCGA TCTTCGCGCC CGCGGTCGCG 
GCGGTGACAC TCGGGATCGT CGGGCCCCGC GCCTTCGCCC GCCGCACCGG GCGCAACGAG 
GCGTTCAATC ACGCAGGCAA TGCGGTGGCG GCGACGCTGG CGGGGGTATC TGCCTATTTT 
TTCGGTCCGG TGGTGGTGTT CTGGCTGATG TCGGCGATGG CCGTCGCCAG CATTTTCGCG 
ACGCTGTCGA TCCCGGCGAA AGCGATCGAC GATCAGGTCG CGCGCGGTCT CGCCTCGATC 
GGCGGACTGG ACGCAGGCCC GCAAGTTCCC GACCAGCGCC ACGACCAGCC CTCGGGTTTC 
AAAGTGCTGA TCACCTGCCG TCCGCTGCTG ATCTTCGCGG CGGCGACCGT GCTGTTTCAC 
TTCGCCAATG CCGCGATGCT GCCGCTGGTC GGGCAGAAGC TCACGCTGGT GAACAGGGAG 
ATCGGCACCA CCCTGATGTC GGTGTGCATC GTCGCGGCGC AGATCGTGAT GGTGCCGGTG 
GCGATGCTGG TCGGGCACAA GGCCGATGTC TGGGGCCGCA AGCCGATCTT TGCGGTGGCG 
CTGGGCGTGC TGGCGCTGCG CGGCGCGCTG TATCCGTTGT CCGACAATCC GTTCTGGCTG 
GTCGGGGTGC AGATGCTCGA CGGCGTCGGG GCCGGCATCT TCGGCGCGCT GTTTCCGCTG 
GTGGTGGCCG ACCTCACCCG CGGCACCGGT CATTTCAATA TCAGCCAGGG CGCGATCGCC 
ACCGCTACCG GGATCGGCGG CGCGCTGTCG ACCGGCGTCG CGGGGCTGAT CGTGGTCACG 
GCCGGCTACA GCGCTGCATT CCTCACCCTC GCTGCGATCG CGGCGCTCGG GCTGGTGCTA 
TTCGTCGTCC TGATGCCCGA GACCCGCCAG ACCGGGCTGC CTGCGATCGG ACTGGCCCCG 
GGCATGCCGG CTGAGTAG

Protein sequence

MPLQQTPGQQ RSLDALNFFL ADVRDGLGPY LAIYLLSVQH WNEASIGLVM TVAAMAGIAA 
QTPAGALIDR STAKRGLLIA AAIAVTLASV TLPLLQSFEA VAATQALAGA AGAIFAPAVA 
AVTLGIVGPR AFARRTGRNE AFNHAGNAVA ATLAGVSAYF FGPVVVFWLM SAMAVASIFA 
TLSIPAKAID DQVARGLASI GGLDAGPQVP DQRHDQPSGF KVLITCRPLL IFAAATVLFH 
FANAAMLPLV GQKLTLVNRE IGTTLMSVCI VAAQIVMVPV AMLVGHKADV WGRKPIFAVA 
LGVLALRGAL YPLSDNPFWL VGVQMLDGVG AGIFGALFPL VVADLTRGTG HFNISQGAIA 
TATGIGGALS TGVAGLIVVT AGYSAAFLTL AAIAALGLVL FVVLMPETRQ TGLPAIGLAP 
GMPAE