Gene RPD_2049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2049
Symbol
ID	4022531
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	2297338
End bp	2298426
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	61%
IMG OID	637962242
Product	twin-arginine translocation pathway signal
Protein accession	YP_569185
Protein GI	91976526
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4663] TRAP-type mannitol/chloroaromatic compound transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.207546
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGTC GTGACTTTCT GAAAGTATCA GCAACCGGCG CCGCGGTCGC GGCGGTGGCC 
TCGCCGGCGA TCGCTCAGTC GTCTCCCGAG GTGAAGTGGC GGTTGACCTC GAGCTTCCCG 
AAGTCTCTCG ACACGATCTA TGGCGGTGCG GAATATCTCG CGAAGCAGGT CGCCGAGATG 
ACCGACAACA AATTCCAAAT CCAGGTGTTC GCCGCCGGCG AAGTGGTTCC GGGTCTGCAG 
GCGCTCGACG CCACGTCGAA CGGCACCGTG GAGATGAGCC ACACGGTTTC CTACTACTAT 
GTCGGCAAGG ATCCGACCTT CGCGGTGTTC GCGTCGGTGC CGTTCGGTCT CAACGCGCGG 
CAGCAGAACT CGTGGCTGTA TCAAGGCGGC GGCAACGAAC TGGCCAACGA ATTCTACAAG 
AAGCACGGCG TGGTCGGCTT CCCCTGCGGC AACACCGGCA CCCAGATGGG CGGTTGGTTC 
CGTAAGGAAA TCAAGACCGT CGCAGACATG TCGGGCCTGA AGATGCGGAT CGGCGGCATC 
GCCGGTCAGG TGCTGCAGAA GGTCGGCGTT GTGCCGCAGC AGATCGCCGG CGGCGACATC 
TATCCGGCGC TGGAAAAGGG CACCATCGAC GCGGCCGAAT GGGTCGGCCC CTATGACGAC 
GAGAAGCTCG GCTTCCAGAA GGTCGCGAAG TACTATTACT ATCCGGGCTT CTGGGAAGGC 
GGCCCGACCG TGCATGCCTT CGCGAACCTC GAAAAGTTCA ATGCGCTGCC GAAGAACTAT 
CAGTCGATCC TGGCCAACGC CGCCGAGTCA ACCAACACCT GGATGGCGGC ACGCTATGAT 
ATGCAGAATC CGACCGCGTT GAAGCGACTG GTGGCGAGCG GCACGCAGCT GCGTCCGTTC 
TCCAACGAAA TCCTCGATGC CTGCCTCAAG GCCACCAACG AGCTGTGGGG CGAAATCTCG 
GCGAAGAACG CCGACTTCAA GAAGGCGATC GACGCGATGC AGGCCTATCG CTCCGACCAG 
TATCTGTGGT GGCAGGTCGC CGAATACACT TACGACAGCT TCATGATTCG CTCGCGCACC 
CGCGGCTGA

Protein sequence

MKRRDFLKVS ATGAAVAAVA SPAIAQSSPE VKWRLTSSFP KSLDTIYGGA EYLAKQVAEM 
TDNKFQIQVF AAGEVVPGLQ ALDATSNGTV EMSHTVSYYY VGKDPTFAVF ASVPFGLNAR 
QQNSWLYQGG GNELANEFYK KHGVVGFPCG NTGTQMGGWF RKEIKTVADM SGLKMRIGGI 
AGQVLQKVGV VPQQIAGGDI YPALEKGTID AAEWVGPYDD EKLGFQKVAK YYYYPGFWEG 
GPTVHAFANL EKFNALPKNY QSILANAAES TNTWMAARYD MQNPTALKRL VASGTQLRPF 
SNEILDACLK ATNELWGEIS AKNADFKKAI DAMQAYRSDQ YLWWQVAEYT YDSFMIRSRT 
RG