Gene RPC_3646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3646
Symbol
ID	3972017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	4055091
End bp	4056416
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	63%
IMG OID	637926755
Product	twin-arginine translocation pathway signal
Protein accession	YP_533500
Protein GI	90425130
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.17089
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.182494
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGGAT TTACCCCGGA TCGCCGAACC TTGCTGAAGG GCAGCGCGCT GACGCTGGCC 
GCCGCGGCGA CGATGTCGGC CGAGCAATTG CTGGGCTATG CCAAGGCCTG GGCGCAGTCC 
GCGCCGTGGA AGCCGGAAGC CGGCGCCAAG ATCAACCTGC TGCGCTGGAA GCGCTTCGTC 
GAAGCCGAGG ACGTCGCCTT CATGAAGATC GTCGAGGCGT TCCAAAAGGC CACCGGCTGC 
GCCGTCAGCG TCTCCAACGA ATCCTATGAC GACATTCAGC CCAAGGCCTC GGTGGCGGCG 
AACACCGGGC AGGGACTCGA CATGGTGTGG GGGTTGTATT CGCTGCCGCA TTTGTTGGGT 
AACAAGGTCA CCGACGTCGC CGACGTCGCG AATTATCTCG GTGGCAAATA CGGCGGCTGG 
ACCAAGTCGG CCGAGGATTA CTGCAAAGTC GGCAACAAAT GGGTCGGCGT GCCGATCGCC 
ACCACCGGCG CGCTGATCAA CTACCGCATC GCCGCCTGCG AAAAGGCCGG CTTCAAGGAA 
TTTCCGAAGG ACACCGCGGG CTTCTTGGAA TTGTGCAAGG GGCTGCAGAA GAACGGCACC 
CCGGCCGGCA TGGCGCTCGG CCACGCCTCG GGCGACGCCA ACACCTGGCT GTATTGGGCG 
CTGTGGACGT TCGGCGGCAA TCTGGTCGAC GCCAACAACA AGGTGGTGAT CAACTCGCCG 
GAAACCGCGG CCTCGCTGGA ATATATCAAG CAGCTCTACG GCACGTTCAT CCCCGGCACG 
GTGTCGTGGA ACGATTCCTC CAACAACAAG GCGTTCCTCG GCGGGCAGTT GCACCTCACC 
GTGAACGGCA TTTCGATCTA CGTCACCGCG AAACGCGAGG CGCCGGCGAT CGCCGAGGAC 
ATGAACCACG CCTATATGCC GATCGGCCCC TACGGCAAGC CGAGCGAAAT GCATCTGGCG 
TTCCCGATGC TGATCTTCAA TTTCACCAAG TATCCGCAGG CCTGCAAGGC GTTCACCGCC 
TTCATGCTGG AAGCGCCGCA GTTCAATCCG TGGATCGAGG CGGCGCAGGG CTATCTGTCG 
CACTTCCTCA ACGCCTACGA CGCCAACCCG ATCTGGACCG CCGACCCCAA GACCACACCG 
TATCGCGACG TCGCCAAGCG CGCCCGCACG CCCGCCGGGC TCGGCACGCT CGGCGAGAAC 
GCGGCGTCGG CGATCGCCGA CTTCATCCTG GTCGACATGT TTGCGAACTA TTGCACCGGC 
CGCGAAGACG TGAAGGGCTC GATCGCCTCG GCGGAACGGC AATTGAAGCG GATCTATCGG 
GCGTGA

Protein sequence

MTGFTPDRRT LLKGSALTLA AAATMSAEQL LGYAKAWAQS APWKPEAGAK INLLRWKRFV 
EAEDVAFMKI VEAFQKATGC AVSVSNESYD DIQPKASVAA NTGQGLDMVW GLYSLPHLLG 
NKVTDVADVA NYLGGKYGGW TKSAEDYCKV GNKWVGVPIA TTGALINYRI AACEKAGFKE 
FPKDTAGFLE LCKGLQKNGT PAGMALGHAS GDANTWLYWA LWTFGGNLVD ANNKVVINSP 
ETAASLEYIK QLYGTFIPGT VSWNDSSNNK AFLGGQLHLT VNGISIYVTA KREAPAIAED 
MNHAYMPIGP YGKPSEMHLA FPMLIFNFTK YPQACKAFTA FMLEAPQFNP WIEAAQGYLS 
HFLNAYDANP IWTADPKTTP YRDVAKRART PAGLGTLGEN AASAIADFIL VDMFANYCTG 
REDVKGSIAS AERQLKRIYR A