Gene RPB_0208 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0208
Symbol
ID	3909449
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	234162
End bp	235745
Gene Length	1584 bp
Protein Length	527 aa
Translation table	11
GC content	66%
IMG OID	637882089
Product	major facilitator transporter
Protein accession	YP_483830
Protein GI	86747334
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.639267
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGACAG CGCACATCGT TGAAAGCGGC CCGGTCTCGA CCGGCGGCAT CGGTCCGCGG 
CCGCTGTTCG CGGTCGGCGC GGTGCTGCTG GGCTCGTTCC TGTCGAATTT CGACAGCCGG 
CTGTTCGCGA TCGCGCTGCC GGATCTGCGG GGCGCGCAGT CGCTGAGCTT CGATCAGGGC 
GCCTGGCTGA GCACCGCCGC CACCGCGTCG CAGATCTTCA TTGCGCCGGC GGTCGCCTGG 
ATGGCGACTG CGTTCGGCCT GCGCCGTGTG CTCGGCCTTC CCAGTCTGGC CTATGCGGTC 
GTGTCGCTGC TGATCCCGCT GGTGCACAGC TATGAGCTGA TGATGGCGCT GAGCGTCGTC 
CACGGTCTTC TGCTCGGCAT CTTCGTTCCG GCGACGCTGC TGATCATCTT TCGCAATCTG 
CCGTTGCGCT GGTGGCTTCC GGCGATTTCG ATCTACGCGA TCCGCGTCGG CTTCAGCCTG 
AATTTCGGCA TCTCGGTGGT CGGGTTCTAT GTCGATCAGA TCGGCTGGCA ATGGCTGTAT 
TGGCAGGACG CGCTGATCGC GCCGCTGCTC GGCCTGTTCG TCTATCTCGG GACGCCGGCC 
GAACCGGTGA ATGCGCCGCT GGTGAAGCAG GCCGATTGGG GCGGCATGCT GCTGCTGGGC 
TCCGGCATGG CGCTGATCTT TGCAGGGCTG GATCAGGGCA ACCGGCTGGA CTGGCTGGGT 
TCGGGAACAG TGGTGGCTTG CCTCGGCTGC GGCGCCGCGC TGGTCGCAGG CTTCTTCGTC 
AATGAGCGCG TCGTCGCCCA GCCCTGGGCG CATGCCAATG TGCTGTTCTC GCGCAATATC 
GGCTTCGCGC TGCTGATCAT CCTGCTGTTC TCGCTGACCA GTCTGTCGAA CTCGCTGCTC 
GCGCCGGATT TCCTGGCGAG CGTTGCGGGA TTGCGGCCGG AGCAATCGGG GCAATTGTTT 
CTGGTCTATG CGGTGCTGCC GATGCTGCTG TGGGTGCCGC TGTCGGTCTG GCTGATCCGC 
CGGATCGATG TCCGGCTGGT GCTGATCGCC GGGCTGGCGG CGTTCTGTGC GGCCGGCCTG 
CTCGGCACCC GGCTCACCCA CGCCTGGGCG CTCGGCGATT TCGTCCCGAT GGTGCTGCTG 
CAATCCTTCG GCCAGGCTTT CACGCTACTG CCGATCGTGA TCATCACGCT GTCCAATTCC 
GATCCGCAGC GCGCCACAGC GTTCGCGGCC TATATTCAGG TCGCCCGGCT CGGTGGCGCC 
GAACTCAGCG TGTCGCTGAT GACGACATGG CTGAGGGTGC GCGAACAATC GTATTCCAAC 
CTGCTGGGGC TGCATGTCGC CAAGGGCGAT CCGCTCGTCA GCGGCGTCCT GTCCGACCTC 
ACTCGGCATT TCGACGGCGC CGGCTCGGGC GAGGCGCAGT CGCGGGCGAT CACGACACTG 
GCGCAGATCG TCCAGCGCGA GGCGAATACG CTGTCGTTCA TCGATGGGTT CTGGCTCGCG 
GCCTGGTTCG GCGTCGCCGC GCTGCTGTGT GCGGCCTGCA TCCGCGCCGC GCCGCCCGGA 
CCATTCACCC CGAAAGGCGG TTGA

Protein sequence

MSTAHIVESG PVSTGGIGPR PLFAVGAVLL GSFLSNFDSR LFAIALPDLR GAQSLSFDQG 
AWLSTAATAS QIFIAPAVAW MATAFGLRRV LGLPSLAYAV VSLLIPLVHS YELMMALSVV 
HGLLLGIFVP ATLLIIFRNL PLRWWLPAIS IYAIRVGFSL NFGISVVGFY VDQIGWQWLY 
WQDALIAPLL GLFVYLGTPA EPVNAPLVKQ ADWGGMLLLG SGMALIFAGL DQGNRLDWLG 
SGTVVACLGC GAALVAGFFV NERVVAQPWA HANVLFSRNI GFALLIILLF SLTSLSNSLL 
APDFLASVAG LRPEQSGQLF LVYAVLPMLL WVPLSVWLIR RIDVRLVLIA GLAAFCAAGL 
LGTRLTHAWA LGDFVPMVLL QSFGQAFTLL PIVIITLSNS DPQRATAFAA YIQVARLGGA 
ELSVSLMTTW LRVREQSYSN LLGLHVAKGD PLVSGVLSDL TRHFDGAGSG EAQSRAITTL 
AQIVQREANT LSFIDGFWLA AWFGVAALLC AACIRAAPPG PFTPKGG