Gene RPC_1045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_1045
Symbol
ID	3969655
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	1146532
End bp	1147968
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	64%
IMG OID	637924156
Product	major facilitator transporter
Protein accession	YP_530928
Protein GI	90422558
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATACAC TCACGGCCGC AGCGCCGTAC GTCATTCGGC GCCCACAAGA CGTTGTCGAT 
ATCGTCAACG CCCACCCGGC GACCCGTTCC GGTCTCGCCG TCACGCTGAT CGCGCTGGGC 
GGCGTCCTGA TCGATGCCTA CCAGGCCGCG ATGATCGGCT TCGGCAATTC GTTCATCGCC 
ACGCAGTTCG GCATTTCGCC GGGGCTTGCG GCGACGGTGA ACGCCTCGGT TCTGGTCTCG 
GCGCTGATCG GCGGCTTGTT GTCGAACCGG ATCATCAATC GCTTCGGCCA GCGCGGCGGC 
TTCCTGATCG GCATGGGGCT TTGCACGGTC GGAGCCTTCG CGATCGCTTT CGCTCCAAAT 
ATCTGGGCTG TGCTGGTGAG TCGGTTGGTG ATGGGATTAG GTCTCGGCAT CGATTTCCCG 
CTGGCAACCG GCGCGGTCGC CGAATTGCGC GGCTCGTCCT CGAAGAAGTC CGGCACGTCC 
GTCAATCTTT GGCAGATGGG ATGGTACCTT TCGACCACGG TGGTCTATCT CATCTTGCTG 
TCGCTCTCGG CGGCGGCGGT CGAGCAGCCG ATGCTGTGGC GTTACGGCAT TTTCATCGGC 
TCCGCCTTCG CCGTGGTCGT CATGGTGCTG CGCTATATCT ACATCGGGGA GTCGGCGATG 
TGGGCGGCGC GCACCTATCG CTACGACGAG TCCTGCAAAA TCCTCAGCGA TCGTTATGAC 
GTCCGGGCCG AAGTGGCCGG GGACGCCACC CACGAGAAGG AGGCAGGGGC CAAGCTGCAC 
GGTGCCTACT CTGTGCTGTT CCGTGCGCCC TATCGTAGAC GGACCATTCT CGGCTGTGTG 
GTCGCCACGA TGCAGGCCTG GCAATACAAT GCGGTCGGCG TCTATCTCCC CTTGACGCTT 
GCGGGCATTC TCTCCGGCGG GCTGTCGAAC GCGCTGTGGG GCTCGGCCGC CGTCAATGCG 
CTATGCGGCG TCACCGGCGG GGCGATCGGT TCGATCCTGG TGCAGAAGAT CGGGGCGCGT 
CGGCAGTCGA TGTTCGGCTT CGGCATGGTG GTGCTGGCGC TGCTGATGCT GGGCTTCATG 
GGCAAGGATA GCCCGTGGCT GGCGCTGGTG TTGCTCGGGC TGATCATCTT CTTTCATTCG 
GCCGGTCCCG GCGGTCTCGG CATGACCATC GCGACCTTGT CGTACCCGCC GAGCATTCGC 
ACGGCGGGCG TCGGTTTTGC GCGCGCGATC ATGCGCGCCG GCGCCCTTTG CGGGCTGATC 
TTCTGGCCGA TCCTTTGGCA GAACCTGCGC ACCGACGCTT TCTACTGGCT GGCAATCGTG 
CCGCTGGTCG GATTTCTGAC CTGTCTTGCG ATCCGCTGGG AGCCGATCGG CGCCAACGTC 
GACGCCGAAG ACGCTTCGGT GCTCTCTATC GTTGCAGTGA AGGAGAATGC GGCATGA

Protein sequence

MNTLTAAAPY VIRRPQDVVD IVNAHPATRS GLAVTLIALG GVLIDAYQAA MIGFGNSFIA 
TQFGISPGLA ATVNASVLVS ALIGGLLSNR IINRFGQRGG FLIGMGLCTV GAFAIAFAPN 
IWAVLVSRLV MGLGLGIDFP LATGAVAELR GSSSKKSGTS VNLWQMGWYL STTVVYLILL 
SLSAAAVEQP MLWRYGIFIG SAFAVVVMVL RYIYIGESAM WAARTYRYDE SCKILSDRYD 
VRAEVAGDAT HEKEAGAKLH GAYSVLFRAP YRRRTILGCV VATMQAWQYN AVGVYLPLTL 
AGILSGGLSN ALWGSAAVNA LCGVTGGAIG SILVQKIGAR RQSMFGFGMV VLALLMLGFM 
GKDSPWLALV LLGLIIFFHS AGPGGLGMTI ATLSYPPSIR TAGVGFARAI MRAGALCGLI 
FWPILWQNLR TDAFYWLAIV PLVGFLTCLA IRWEPIGANV DAEDASVLSI VAVKENAA