Gene RPD_4124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4124
Symbol
ID	4024646
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4589038
End bp	4590246
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	70%
IMG OID	637964332
Product	major facilitator transporter
Protein accession	YP_571244
Protein GI	91978585
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.278491
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCGC TGCGCAGCCT CGCGTTTGGA CCCGGACGCG CGGTCGTCGT GCTGTCGTTC 
ACCCAGATCC TGTGCTGGGG CATCCTGATC TACCCTCCTG TGCTGACCAT GCCGCATCTG 
ACGGCGGATC GGGGCTGGTC GCTGGCGTTC GGGATGGCGG GATTTTCGCT GGCGCTGGTG 
ATGTCCGGGA TCATGTCGCC GATCGTCGGC GGCCTGATCG ATCGCCGGGG CGGCAATCTC 
GTGATGGCAC CCGGCGCATT GGCTGGGGCG CTCGGACTGG CGCTGCTCGC CAGCACCGAC 
GCATGGCCGC TCTATTTCGC GAGCTGGGCG CTGATCGGCG TTTCGATGGC CTCGAGCCTG 
TACGATCCGG CCTTCGCCAC GCTGGCGCGA TTGTTCGGCA GCTCGGCGCG GCGGCAGATC 
ACCTTCGTCA CTTTCGCAGG GGGCTTCGCC TCGACGGTCG GCTGGCCGGC GACGCATCTG 
TTGCTGGAAC ATGTCGGCTG GCGCGGCACC TATCTGGTGT TCGCCGCCGT GCTGGCCTTC 
GTCGTCGCAC CGCTGCACGC CTTTGCGTTG CCGAGAACGC CGTCGCCGTC CCAGGGGGCG 
GTCCCGCCCA GCCCGCATCT GGTGCCGGAG CAACCGCTGC GGCCCGAAGG GCGGGTTTTC 
ATCCTGCTGG CGATGGGGTT CGCGCTGCAT GCGCTGATCC TGTCCGGCGT CACCTCGAAC 
CTGCTGTCGA TGCTCGAACG CGGCGGGCTG AGCGCCGCCA CGGTGGTGAC GTTGGGGGCG 
CTGTTCGGTC CCGCGCAGGT CGCGGCGCGC CTGGTCGATT TCCTGCTGGC GGGCCGCACC 
CATCCGTTGT GGATCGCGCG CGGGGCGATC GCGCTGATGG CGGTCGCGTT CGCGATGCTG 
GCGTTCGTCG GGGTATCGGT CGTCGTCGCA GGGCTGTTCT GCATCGCCTT CGGCGCGGCC 
AACGGCGTGA TGACGATCGC GCGTGGCAGC CTGCCGCTGC TGATGTTCGG GCCGCAAGGT 
TATGGCCGGG TGATCGGGCG CATCGCGCGG CCGGCGCTGT TCGTCCAGGC ATCGGCGCCG 
TTCGTGGTCG CGGCGGCGGT CGAACGATTT TCCGACGCCG TGGTGATCGA GGTCGGGATG 
GCGGCGGCGC TGGTCGGCGT CGGCTGCTTC CTGCTGATCC GGACGCCGCG CGCGGCGCCG 
CGGCAATAG

Protein sequence

MTALRSLAFG PGRAVVVLSF TQILCWGILI YPPVLTMPHL TADRGWSLAF GMAGFSLALV 
MSGIMSPIVG GLIDRRGGNL VMAPGALAGA LGLALLASTD AWPLYFASWA LIGVSMASSL 
YDPAFATLAR LFGSSARRQI TFVTFAGGFA STVGWPATHL LLEHVGWRGT YLVFAAVLAF 
VVAPLHAFAL PRTPSPSQGA VPPSPHLVPE QPLRPEGRVF ILLAMGFALH ALILSGVTSN 
LLSMLERGGL SAATVVTLGA LFGPAQVAAR LVDFLLAGRT HPLWIARGAI ALMAVAFAML 
AFVGVSVVVA GLFCIAFGAA NGVMTIARGS LPLLMFGPQG YGRVIGRIAR PALFVQASAP 
FVVAAAVERF SDAVVIEVGM AAALVGVGCF LLIRTPRAAP RQ