Gene RPB_1676 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1676
Symbol
ID	3908663
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1907753
End bp	1908988
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	67%
IMG OID	637883570
Product	major facilitator transporter
Protein accession	YP_485295
Protein GI	86748799
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCAG CCCAGCTCAG CTCGTTTCAG CGCTGGTCGA TTCTGATCGG CGCGTCCGTG 
CTGCTCAGCC TCGCAATGGG CATGCGGCAG AGCTTCGGGC TGTTTCAGCC GTCCGTGATT 
CGCGATATCG GCATCACCAG CGCCGACTTC TCGCTGGCGA CGGCCCTGCA GAACATCATC 
TGGGGCGTGA CGCAGCCGAT GGTCGGGCTG CTCGCCGACC GCTACGGCAC CCGCTGGGTG 
ATGCTCGGCG GCGTCGTGGT CTATGCCGCC GGTCTGGTGC TGATGATGGT TGCCGAATCG 
GCGCTGGTGT TCACGCTCGG CGCCGGCGTC TGCGTCGGCA TCGCGCTGTC CTGCACCGCC 
TCCAGCATGA CCATGACCGT CACGTCGCGC ACGGTGTCGG CGGCCAAGCG CAGCGTCGCG 
ATGGGCGCGG TGTCGGCGGC CGGATCGCTC GGCCTGGTGA TCGCCTCGCC GCTGGCGCAG 
ACGCTGATCA CCACCGCGGG CTGGCAGATG GCGCTGATCG GCTTTCTCGG CCTCGTCGCG 
GTGATGCTGC CGTCGGCGCT GTTCGCCGGC CGCGCCGACA AGATCGAGAT CGAGAAGGCC 
GACGATCTGC AGCAGTCGGC CGGCGAAGTG GTGCAGAGCG CCCTCGGCCA TTCCGGCTTC 
ATGGTGATGG CGATCGCGTT CTTCGTCTGC GGGCTGCAGC TCGTCTTCAT CACCACGCAT 
CTGCCGAACT ATCTGGCGAT CTGCGGCCTC GATCCGTCGC TCGGCGCCAG CGCGCTGGCG 
GTGATCGGAT TGTTCAACGT GATCGGCTCC TACGCCTTCG GCTGGCTCGG CGGGCGCTAT 
CCCAAACAAT ATCTGCTCGG CGGCATCTAC ATCGTGCGCT CGCTGGCGAT CGCGGCGTAT 
TTCTACTTCC CGGCGTCGGC GACCACCACG CTGGTGTTCG CCGCGGTGAT GGGCACGCTG 
TGGCTCGGGG TGATTCCGCT GGTCAACGGC CTGGTCGCGC AACTGTTCGG GCTGCGCTAC 
ATGGCGACGC TGACCGGCAT CGCCTTCCTC AGCCATCAGG TCGGCTCGTT CATCGGCGCC 
TGGGGCGGCG GCGTGATCTA CGATCATCTC GGCAATTATG ATCGCGCCTG GCAGGCGGCG 
GTTCTGATCG GGCTGATCGC AGGCACCGCG CAGATGCTGA TGAACGTTCG CCCGCCGCAG 
CGGCGGGAGG GCCTCGCGGT GCCGGCCACG GCGTGA

Protein sequence

MKAAQLSSFQ RWSILIGASV LLSLAMGMRQ SFGLFQPSVI RDIGITSADF SLATALQNII 
WGVTQPMVGL LADRYGTRWV MLGGVVVYAA GLVLMMVAES ALVFTLGAGV CVGIALSCTA 
SSMTMTVTSR TVSAAKRSVA MGAVSAAGSL GLVIASPLAQ TLITTAGWQM ALIGFLGLVA 
VMLPSALFAG RADKIEIEKA DDLQQSAGEV VQSALGHSGF MVMAIAFFVC GLQLVFITTH 
LPNYLAICGL DPSLGASALA VIGLFNVIGS YAFGWLGGRY PKQYLLGGIY IVRSLAIAAY 
FYFPASATTT LVFAAVMGTL WLGVIPLVNG LVAQLFGLRY MATLTGIAFL SHQVGSFIGA 
WGGGVIYDHL GNYDRAWQAA VLIGLIAGTA QMLMNVRPPQ RREGLAVPAT A