Gene RPB_3392 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3392
Symbol
ID	3911194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	3877125
End bp	3878213
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	63%
IMG OID	637885295
Product	twin-arginine translocation pathway signal
Protein accession	YP_486999
Protein GI	86750503
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4663] TRAP-type mannitol/chloroaromatic compound transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.354915
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGTC GTGACTTTCT GAAAGTATCA GCAACCGGCG CCGCGGTCGC GGCGGTGGCT 
TCGCCGGCGA TTGCGCAATC GTCCCCAGAG GTGAAGTGGC GGTTGACCTC GAGCTTCCCG 
AAGTCGCTCG ACACCATCTA TGGCGGCGCG GAATATCTCG CGAAGCAGGT CGCCGAGATG 
ACCGACAACA AGTTTCAGAT CCAGGTGTTC GCCGCCGGCG AAGTGGTCCC CGGCCTGCAG 
GCGCTCGACG CGACCTCGAA CGGCACCGTC GAGATGTGCC ACACCGTGTC GTACTACTAT 
GTCGGCAAGG ATCCGACCTT CGCGGTGTTC GCCGCGGTTC CGTTCGGCCT CAACGCCCGC 
CAGCAGAATT CGTGGCTGTA CCAGGGCGGC GGCAACGAGC TCGCCAACGA GTTCTACAAG 
AAGCACAACG TGGTCGGCTT CCCCTGCGGC AACACCGGCA CCCAGATGGG CGGCTGGTTC 
CGCAAGGAGA TCAAGACCGT CGCCGACATG AGCGGCCTGA AGATGCGGAT CGGCGGCATC 
GCCGGTCAGG TGCTGCAGAA GGTCGGCGTG GTGCCGCAGC AGATCGCCGG CGGCGACATC 
TACCCGGCGC TGGAAAAGGG CACCATCGAC GCCGCCGAGT GGGTCGGCCC CTATGACGAC 
GAGAAGCTCG GCTTCCAGAA GGTCGCGAAG TACTACTACT ATCCGGGCTT CTGGGAAGGC 
GGCCCGACCG TCCACGCCTT CACCAATCTC GAGAAGTTCA ACGCGCTGCC GAAGAACTAT 
CAGGCGATCC TCGCCAACGC GGCGGTGCAT ACCAACACCT GGATGAACGC GCGCTACGAC 
ATGCTCAACC CGACCGCGCT GAAGCGGCTG GTGGCGAGCG GCACGCAGCT GCGTCCGTTC 
TCCAACGAAA TCCTCGACGC CTGCCTCAAA TCGACCAACG AGCTGTGGGG CGAGATCTCG 
GCCAAGAACG CCGACTTCAA GAAGGCGATC GACGCGATGC AGGCCTACCG CTCGGATCAG 
TATCTGTGGT GGCAGGTCGC CGAATACACC TACGACAGCT TCATGATCCG CTCGCGCACC 
CGCGGCTGA

Protein sequence

MKRRDFLKVS ATGAAVAAVA SPAIAQSSPE VKWRLTSSFP KSLDTIYGGA EYLAKQVAEM 
TDNKFQIQVF AAGEVVPGLQ ALDATSNGTV EMCHTVSYYY VGKDPTFAVF AAVPFGLNAR 
QQNSWLYQGG GNELANEFYK KHNVVGFPCG NTGTQMGGWF RKEIKTVADM SGLKMRIGGI 
AGQVLQKVGV VPQQIAGGDI YPALEKGTID AAEWVGPYDD EKLGFQKVAK YYYYPGFWEG 
GPTVHAFTNL EKFNALPKNY QAILANAAVH TNTWMNARYD MLNPTALKRL VASGTQLRPF 
SNEILDACLK STNELWGEIS AKNADFKKAI DAMQAYRSDQ YLWWQVAEYT YDSFMIRSRT 
RG