Gene RPD_4068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4068
Symbol
ID	4024585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4520382
End bp	4521461
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	67%
IMG OID	637964271
Product	ABC transporter related
Protein accession	YP_571188
Protein GI	91978529
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.412838
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTCA GCCTGGAGAA TGTCACCAGG ATGATCGACG GCGTGCCGGC GATCCGCGAC 
GTGTCGCTGA CGCTGGAGCG CGGCACGCTG AGCGTGCTGC TCGGGCCGAC GCTGTCGGGC 
AAGACCTCGA TCATGCGGCT GCTCGCCGGC CTCGACAAGC CGACCACAGG CCGCGTGCTG 
GTCGACGGAA AGGACGTCAC CGGGTTCGAC GTGCGCAAGC GTTCGGTGGC GATGGTGTAT 
CAACAATTCA TCAATTACCC GTCGCTGACG GTCTATGAGA ACATCGCCTC GCCGCTGCGG 
GTGCAGGGCA AGTCGCGCGA CGAGATCGAG CAGCGCGTGC AGGAGGCGGC CAAGCTGCTG 
AAGCTCGAGC CGTATCTGAA GCGCACGCCG CTGCAACTCT CCGGCGGCCA GCAGCAGCGC 
ACCGCGATCG CCCGCGCGCT GGTCAAGGGC GCCGATCTCG TGCTGCTCGA CGAGCCGCTC 
GCCAATCTCG ACTACAAGCT GCGCGAAGAA CTGCGCACCG AACTGCCGCG GATCTTCGAG 
GCGTCGGGTG CGATCTTCGT CTACGCCACC ACCGAGCCCT CCGAGGCGCT GCTGCTCGGT 
GGTCGCACCG TCTGCATGTG GGAAGGACAG GTGCTGCAGA CCGGCCCGAC GCCCTACGTC 
TATCGGCAGC CCGACACCAT GCGGGTCGCG CAGGTGTTCT CCGATCCGCC GCTCAATATT 
GTCGGCGCGG AGAAGAAGGC CGGCACCGTG CATTATGCCG GCGGCGTTAC GGCGCCCGCC 
ACTGGCGTCT TCGCCGGGCT CGGCGACGGC GCCTATCGGG TCGGCTTCCG CGCCCATCAG 
ATCGAGGTCG CGCGCGTCAA TCCGGATCGC CACGCGTTCC AGGCCACCGT CGCGGTGACC 
GAGATCACCG GCTCGGAGAG CTTCGTGCAT CTCAAGCGCG GCGACGACAA TTGGGTCGCG 
GTGCTGCACG GCGTCCACGA GTTCGAACCG GGCCAAACCC TGGACGCGAT CCTCGACCCC 
GCCAATCTGT TCGTGTTCGA CGCGGCCGAC CGCCTCGTCG CCGCGCCGAA GCCGATGTGA

Protein sequence

MSVSLENVTR MIDGVPAIRD VSLTLERGTL SVLLGPTLSG KTSIMRLLAG LDKPTTGRVL 
VDGKDVTGFD VRKRSVAMVY QQFINYPSLT VYENIASPLR VQGKSRDEIE QRVQEAAKLL 
KLEPYLKRTP LQLSGGQQQR TAIARALVKG ADLVLLDEPL ANLDYKLREE LRTELPRIFE 
ASGAIFVYAT TEPSEALLLG GRTVCMWEGQ VLQTGPTPYV YRQPDTMRVA QVFSDPPLNI 
VGAEKKAGTV HYAGGVTAPA TGVFAGLGDG AYRVGFRAHQ IEVARVNPDR HAFQATVAVT 
EITGSESFVH LKRGDDNWVA VLHGVHEFEP GQTLDAILDP ANLFVFDAAD RLVAAPKPM