Gene RPB_1643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1643
Symbol
ID	3909920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1872997
End bp	1874226
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	65%
IMG OID	637883537
Product	major facilitator transporter
Protein accession	YP_485262
Protein GI	86748766
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.916878
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCCGCA ACTACGTCAT CGTCACGGCC TCCTATTGGG GCTTCACGCT GGTCGACGGC 
GCGTTGCGGA TGCTGGTGCT ATTTCACTTC TTCCGACTGG GCTACACCCC GTTCACGCTG 
GCGTTTCTGT TTCTGCTGTA TGAGGCAGCC GGCATCGCGG CGAATCTGGC GGGTGGCTAC 
TTCGCCTCTC GATTCGGCAT TCCGCGGATG CTGGCCATTG GTCAGGCGCT GCAGATCGCC 
GGCCTGTTGA TGCTGTCGGC GCTCGATCCG GCATGGACCG TGGCGGCCTC GGTGGCCTGG 
GTGGTGGCGG CGCAGGGCAT CGCCGGCGTC GCCAAGGACC TGACCAAGAC CGCTTCGAAA 
TCCGCCATCA AGGCGACCTC GGCGGAGGGC AGCGGGCAGT TGTTCCGCTG GGTGGCCTGG 
TTCACCGGAT CGAAGAACGC GATGAAGGGC ATCGGCTTCT TCCTCGGTGG CCTGTTGCTC 
GACCTCGTCG GCTTTCGGCC CGCGCTCTGG CTGATGGCTG CGCTGCTCGG GGTGATCTTT 
GTCGCTGGTC TGGCTCTGCT GCCGCGCCAG CTCGGCAAGG CCAAGTCGTC GAAAACGATA 
CGCGAACTGT TCGGCAAGTC GCGCGGCGTG AACCTGCTGG CCGCCGCCCG CATCTTCATG 
TTCGGGGCGA GGGACGTCTG GTTCGTCGTC GGCCTTCCTG TGTTCCTGTA TGCCAACGGT 
TGGCGCTTTC TCGAGGTCGG CGGATTTCTG GCGGCGTGGA CGATCGCTTA TGGCGGCATC 
CAGGCAATCG CGCCGAGCCT GGTGACGCGG AGCGACGACG GCCTCAGCCG CGAAATCCCA 
GCGGCGCGAC TATGGGCCTT GCTCCTCGCC GCGGTGCCGA TCGTGTTGGC CGTGGCGATG 
GTCGCAGTCC CGATGGTGCG CCCGGATCTG GTGCTGGTGA TCGGTCTGGC GCTGTTCGGC 
GTGCCGTTCG CGGTGAATTC GTCGCTGCAT TCCTATCTGA TCCTGGCCTA TGCCGGATCG 
GAAAAGGCCG CCGAGGATGT CGGCTTCTAC TACGCGGCGA ATGCGGCTGG GCGGCTGCTC 
GGGATCATTC TGTCGGGCGC GCTGTACCAG CTCGCGGGCA TCACCGGCTG TCTCATGGGA 
TCTGCGGTCA TGCTGCTGCT GTGCTGGCTG ATCACGCTGG TGTTGCCGGT GACGGCTAGT 
CCAACTCCGA TCCGACAGCA GCCGATCTGA

Protein sequence

MVRNYVIVTA SYWGFTLVDG ALRMLVLFHF FRLGYTPFTL AFLFLLYEAA GIAANLAGGY 
FASRFGIPRM LAIGQALQIA GLLMLSALDP AWTVAASVAW VVAAQGIAGV AKDLTKTASK 
SAIKATSAEG SGQLFRWVAW FTGSKNAMKG IGFFLGGLLL DLVGFRPALW LMAALLGVIF 
VAGLALLPRQ LGKAKSSKTI RELFGKSRGV NLLAAARIFM FGARDVWFVV GLPVFLYANG 
WRFLEVGGFL AAWTIAYGGI QAIAPSLVTR SDDGLSREIP AARLWALLLA AVPIVLAVAM 
VAVPMVRPDL VLVIGLALFG VPFAVNSSLH SYLILAYAGS EKAAEDVGFY YAANAAGRLL 
GIILSGALYQ LAGITGCLMG SAVMLLLCWL ITLVLPVTAS PTPIRQQPI