Gene RPD_1045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1045
Symbol
ID	4021521
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1198041
End bp	1199264
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	63%
IMG OID	637961237
Product	twin-arginine translocation pathway signal
Protein accession	YP_568184
Protein GI	91975525
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.457214
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAGCG ACTCACCCCA CAATCTCACC CGCCGCCGCT TCCTCTCCAA CTTCGCCTTC 
GCGAGCACAG GGCTGGCGAC CGGCGTCGGC AGCTGGGTGG TGCGGCCCGA TTGGGCCAAC 
GCCGCCGCCG GCGCGATCAA GGTCGGCATC GCCACCGACC TGACCGGCCC GATGGGTTAC 
GCCGGCAACG CCGACGCCAA CGTCGCCAAG ATGGTGTTGA AGCAGATCAA CGACGCCGGC 
GGCCTGCTCG GCCGTCCTTT GGAGCTCTAC ATCGAGGACA CCGCCTCCAA CGAAGCGGTC 
GCGGTCGGCA ACGTCCGCAA GCTGATCCAG CGCGACAAGG TCGATCTCGT GCTCGGCGGC 
ATCACCTCGT CGATGCGCAA TGCGATCAAG GACGTCATCG TCGCACGCGG AAAGACGCTG 
TACATTTATC CACAGCTTTA CGAAGGCAAG GAATGCACGC CCAACCTGTT CTGCACCGGA 
CCGACCCCGG CGCAGCAGTG CGATGAATTC ATCCCGTGGC TGATCAAGAA CGGCGGCAAG 
AAATTCGCGC TGCCGAGCGC CAATTACGTC TGGCCGCACA CGCTCAATGT CTATGCCCGC 
AAGGTGATCG AGGCCAATGG CGGCGAGGTC GTGCTGGAGG AATACTACCC GCTCGACCAG 
ATCGACTTCT CATCGACGGT CAACCGAATC ATCTCCAACA AGGTCGACGT CGTATTCAAT 
ACCGTGATCC CGCCGGGCGT CGGTCCGTTC TTCAAGCAAC TCTATGAGGC CGGCTTCCTC 
AAGAACGGCG GCAGGCTGGC CTGCGTCTAC TACGACGAGA ATACGCTCGG CATCAATCAG 
CCTGCGGAGA TCGAGGGCCT CGCGAGCTGC CTCGACTACT TCAAGGCCGT CGCCAAGACC 
GATCCGGTCA GCGCTAAAAT CCAGGCGGAA TACGACAAGG CCTACCCTGG CAACTTCCTG 
TTTGCCGCGG GCAGCGCCGC CACCGGTACC TATCGCGGCC TGAAGCTCTG GGAGGCTGCG 
GTGAAGGAAG CCGGCAAGAT CGACCGCGAC GGCGTCGCCA CGGCGATGGA TCACGCCAAG 
ATCACCGACG GCCCGGGCGG GCCGGCTGAG ATGGTGCCGG GCAAACGGCA TTGCAAGATG 
AACATGTACA CCGCGGTGGC CAAGAACGGC AGCTACGAGA TCATCGCCCG CAGTAACGGC 
CTGGTCGATC CGAAGGAATG CTGA

Protein sequence

MSSDSPHNLT RRRFLSNFAF ASTGLATGVG SWVVRPDWAN AAAGAIKVGI ATDLTGPMGY 
AGNADANVAK MVLKQINDAG GLLGRPLELY IEDTASNEAV AVGNVRKLIQ RDKVDLVLGG 
ITSSMRNAIK DVIVARGKTL YIYPQLYEGK ECTPNLFCTG PTPAQQCDEF IPWLIKNGGK 
KFALPSANYV WPHTLNVYAR KVIEANGGEV VLEEYYPLDQ IDFSSTVNRI ISNKVDVVFN 
TVIPPGVGPF FKQLYEAGFL KNGGRLACVY YDENTLGINQ PAEIEGLASC LDYFKAVAKT 
DPVSAKIQAE YDKAYPGNFL FAAGSAATGT YRGLKLWEAA VKEAGKIDRD GVATAMDHAK 
ITDGPGGPAE MVPGKRHCKM NMYTAVAKNG SYEIIARSNG LVDPKEC