Gene RPD_3322 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3322
Symbol
ID	4023832
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	3680943
End bp	3682268
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	63%
IMG OID	637963526
Product	twin-arginine translocation pathway signal
Protein accession	YP_570447
Protein GI	91977788
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGACT TCACATTCGA TCGCCGCTCG TTGCTGAAGG GTGGCGCGCT GACTCTGGCC 
GCGGCGGCGA CCATGTCCGC GGATCAATTG CTGGGTTATG CGAAGGCCTG GGCGCAGACC 
TCGCCGTGGA AGCCGGAAGC CGGCGCCAAG ATCAATCTGC TGCGCTGGAA GCGCTTCGTC 
GAGGCCGAAG ACGTCGCCTT CATGAAGATC GTCGATGCGT TCCAGAAGGC CAACAACGTC 
ACCATCAACG TTTCCAACGA ATCCTACGAC GACATCCAGC CGAAGGCTTC GGTCGCCGCC 
AATACCGGGC AGGGTCTCGA TATGGTGTGG GGCCTATATT CGCTGCCGTT CCTGTTCCCG 
AGCAAGTGCA CCGACGTCTC CGACGTCGCC GACCACCTCG CCAAAAAGTG CGGCGGCTGG 
ACCGATTCCG GCAAGGCCTA TGGCATGCAC AACGGCAAGT GGATCGGCAT TCCGGTCGCG 
GCGACCGGCG GCCTCGTCAA CTACCGCATC AGCGCGGCGG AGAAAGCGGG CCACAAGGAG 
TTTCCGAAGG ACCTCGCCGG CTTCTCGGAT CTGATCAAGG GCCTGAACAA GAACGGCACG 
CCGGCCGGAA TGGCGCTCGG CCACGCCTCG GGCGACGCCA ACAGCTGGCT GCACTGGGCG 
CTGTGGGCGC ATGGCGGAAG GCTGATCGAC AAGGACAACA AGGTCGTCGT CAATTCACCC 
GAGACCGCAA AGGCGCTGGA GTACACCAAG GGTCTGTACG ACAGTTTTAT TCCCGGCACG 
GCGTCGTGGA ACGACGCGTC CAACAACAAG GCGTTTCTGG CCGGCCAGCT CTATCTCACC 
GTCAACGGCA TCTCGATTTA CGTGACGGCC AAGAAGGACA ACAAGGAGAT GGCGGCGGAC 
ATCAACCACG CGCATCTGCC CGCCGGCGTC AGCGGCAAGA CCCGCGAAAT GCATCTCGGC 
TTTCCGATCC TGATCTACAA CTTCACCAAG TTCCCGAACA CCTGCAAGGC GTTCACCGCC 
TTCATGATGG AGCCGGAGCA GTTCAACCCG TGGGTCGAGG CGGCGCAGGG CTATCTGTCG 
CCGTTCCTGC TCGACTACGA GAAGAATCCG ATGTGGACGG CGGACCCGAA GAACACCCCA 
TATCGCGACG TCGGACGCAC GGCGTCGACG CCGGCCGGCG ACGGTCAGAT GGGCGAGAAC 
GCCGCCGCCG CGATCGCCGA CTTCGTCATC GTGGATATGT TTGCGAACTA CTGCACCGGT 
CGCGAGGACG TGAAGACCGC GATGAGCAGC GCCGAACGCG CGGCGAAGCG GATCTTCCGG 
GCGTGA

Protein sequence

MTDFTFDRRS LLKGGALTLA AAATMSADQL LGYAKAWAQT SPWKPEAGAK INLLRWKRFV 
EAEDVAFMKI VDAFQKANNV TINVSNESYD DIQPKASVAA NTGQGLDMVW GLYSLPFLFP 
SKCTDVSDVA DHLAKKCGGW TDSGKAYGMH NGKWIGIPVA ATGGLVNYRI SAAEKAGHKE 
FPKDLAGFSD LIKGLNKNGT PAGMALGHAS GDANSWLHWA LWAHGGRLID KDNKVVVNSP 
ETAKALEYTK GLYDSFIPGT ASWNDASNNK AFLAGQLYLT VNGISIYVTA KKDNKEMAAD 
INHAHLPAGV SGKTREMHLG FPILIYNFTK FPNTCKAFTA FMMEPEQFNP WVEAAQGYLS 
PFLLDYEKNP MWTADPKNTP YRDVGRTAST PAGDGQMGEN AAAAIADFVI VDMFANYCTG 
REDVKTAMSS AERAAKRIFR A