Gene RPB_2999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2999
Symbol
ID	3910798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	3413803
End bp	3415029
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	70%
IMG OID	637884905
Product	major facilitator transporter
Protein accession	YP_486612
Protein GI	86750116
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.548657
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0674552
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGACCAGC GCGCATCGCA GCGGACCGGC CTCGTCGTGC TCGGCGTGTG CTTCGTGCTG 
TCGCTGCTCG GCCGCGGCCT GGGCGAGAGC TTCACCGTCT TCCTGCTGCC GATCTCGCAA 
TCGTTCGGCT GGGACCGCGC CGAGGTGGTG TCGATCTATT CGCTGACTGC GCTGTGCAGC 
GGCATCGCCT CGCCCTTCGT CGGCCGTCTG TTCGACCGCT CCGGCCCGCG CCTCGTCTAT 
ATGCTCGGAC TGCTGCTGCT CGGCGGCGCC TTCCTCGGTG CGGCCATCGC GCAGCAGCTC 
TGGCAATTGC AGCTCGCCGT CGGCCTCTGC GTCGGGCTCG GCATCGCCTT CACCGGCACC 
GTGCCGAACT CGATCCTGCT CGGCCGCTGG TTCGGACCGC GGCTGCCAAC CGCGATGGCC 
GTGGTGTATT CCGCGACCGG CGCCGGCGTG CTGCTGCTGC TGCCGATCGC CCAGCTGCTG 
ATCGAGCGTT CCGGCTGGCG CGGCGCCTAC GAGTTGCTGG GCGCGGCGAT GCTGCTGCTG 
CTGGTGCCGC TGCTGATGCT GCCGTGGCGG CGCTATGCCC AGGGTGCGCC GGGCGGCATC 
GCGGCGCACG CCGCCTCGCT CGACGCACCC GACGACGGCT GGACGCTGCG CGCGGCGATG 
CGGCACCACG CGTTCTGGGC GCTGTTCGCG ACGTTCTTCT TCACCGCGAT CGGGATGTAC 
GCGATCGCAG CCCAAGTCGT CGCCTATCTG ATCGACGCCG GCTTTCCGCC GCTGCAGGCG 
GCGACCGCCT GGGGCTTCTC CGGCGTGGTG CTGGTGATCG GCATGCTCGG CGTGAGCTGG 
CTCGACGGCG TGATCGGCCG CCGGCCCTCG ATCCTTTTCT CCTATGCGGT CTCGATCGCC 
GGCATCGTGA TGCTGTGGCT GCTGAAATCC TATCCCGACT ACGTCCTGCT GACCGGCTTC 
GTCGTCTGCT TCGGCAGCAT GATCGGCTCG CGCGGCCCGC TGATCACCGC GACCGCGATG 
AAGCTGTTTC GCGGCCGGCA CGTCGGCCTG ATCTACGGCA CGATCGCGAT CGGCAGCGGG 
CTCGGCTCGG CGTTCGGCTC CTGGTGCGGC GGCCTGATCC ACGACCTCAG CGGCAGCTAC 
GACCCGGTGA TCGGCTTCGC GCTGGTCGCC GTGCTGCTCG GGATGATTCC GTTTCTGGTG 
GTGCCGGCGC TGCGCGAGCG GTCCTGA

Protein sequence

MDQRASQRTG LVVLGVCFVL SLLGRGLGES FTVFLLPISQ SFGWDRAEVV SIYSLTALCS 
GIASPFVGRL FDRSGPRLVY MLGLLLLGGA FLGAAIAQQL WQLQLAVGLC VGLGIAFTGT 
VPNSILLGRW FGPRLPTAMA VVYSATGAGV LLLLPIAQLL IERSGWRGAY ELLGAAMLLL 
LVPLLMLPWR RYAQGAPGGI AAHAASLDAP DDGWTLRAAM RHHAFWALFA TFFFTAIGMY 
AIAAQVVAYL IDAGFPPLQA ATAWGFSGVV LVIGMLGVSW LDGVIGRRPS ILFSYAVSIA 
GIVMLWLLKS YPDYVLLTGF VVCFGSMIGS RGPLITATAM KLFRGRHVGL IYGTIAIGSG 
LGSAFGSWCG GLIHDLSGSY DPVIGFALVA VLLGMIPFLV VPALRERS