Gene RPD_1920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1920
Symbol
ID	4022402
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2158295
End bp	2159647
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	68%
IMG OID	637962113
Product	twin-arginine translocation pathway signal
Protein accession	YP_569056
Protein GI	91976397
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.69001
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCTCG ACAGGCGTCG ACTGATCGGA TTAGCAGCCG CAGCGCTGAC GCTGTCGGCG 
ACACCGATGC GCGCGGCCCC GACCTCGCAA CGTGGCCGCG ACGCTGCCCA GCTCGGTATT 
CGTCCCGACA GCTCTGATGA CCAGACCGCG GCGCTGCAAC GCGCAATCGA CAATGCCGCA 
CACGCCCGCG TCCCGCTGGC GCTGCCGCCC GGCAATTATC GCACCGGTAC CCTCCGATTG 
CCGTCAGGCG CACAGCTCAG CGGCGTCCGT GGCGCAACGC GCTTGATCTT CACCGGTGGA 
CCGTCGCTGT TCGACAGCGC CGGCGCCGAG ACGCCGACGC TGAACGGCCT CGTCCTCGAC 
GGCGGCGCGA TCCCGCTGCC GGCGCGGCGC GGCCTCGTAC ATGTCGTCGG CGCACGCAAC 
CTGCGCATCA CGGATTGCGA GATCACCGCC AGCGGCGGCA GCGGCGTCTG GCTCGAAACC 
ACCTCCGGCG CGATCACCGA CAATTTGCTG ACCGCGATCG CGGTGACCGG CGTGGTGTCG 
TTCGACGCCA AGGGCCTGAG TGTCTCACGC AACGCCCTCG TCGGGGCCAA CAACAACGGC 
ATCGAGATCC TGCGCACCTC GATCGGCGAC GACGGCAGCA TCGTCACCGG CAACAGGATC 
GAGAACATCA AGGCCGGCCC CGGCGGCTCG GGCCAGTACG GCAACGCCAT CAACGCGTTT 
CGCGCCGGCA ACGTCATCGT CAGCGGCAAC CGGATCAAGA ACTGCGATTA CTCCGCCGTA 
CGAGGCAATT CGGCGTCGAA CATCCACATC ACCGACAATA GCGTCAGCGA CGTGCGCGAG 
GTCGCGCTGT ACTCCGAATT CGCGTTCGAG GGCGCGGTGA TCTCGGGTAA CACCGTCGAC 
GGAGCCGCGC TCGGCGTCTC GGTCTGCAAT TTCAACGAGG GCGGACGGCT CAGCGTCGTG 
CAGGGCAACA TCATCCGCAA TTTGTTGCCG AAGCGGCCGA TCGGCACCGC GCCGGACGAC 
GACGCCGGGA TCGGCATCTA TGTCGAGGCC GACACCGCGG TGACTGGCAA TGTGATCGAG 
AACGCGCCGT CGTTCGGCAT CGTCGCCGGC TGGGGGCGAT ATCTGCGCGA CGTCGCGATC 
ACCGGCAACG TCGTGCGCAG GGCGTTCGTC GGCATCGGCG TGTCCGTTGC CGAAGGCGCC 
GGCACCGCCA CGATCAATGG CAACGTCATC GCCGAGGCGT CGCGTGGCGC AGTCGTCGGG 
CTCGATCACG CGCGGCCGGT GACGCCGGAC CTGACCGCGC CCGGGGCTGC GCGGTTCGCC 
CAGATCGCGC TCGGCAGTAA TTCGGTGCGG TGA

Protein sequence

MALDRRRLIG LAAAALTLSA TPMRAAPTSQ RGRDAAQLGI RPDSSDDQTA ALQRAIDNAA 
HARVPLALPP GNYRTGTLRL PSGAQLSGVR GATRLIFTGG PSLFDSAGAE TPTLNGLVLD 
GGAIPLPARR GLVHVVGARN LRITDCEITA SGGSGVWLET TSGAITDNLL TAIAVTGVVS 
FDAKGLSVSR NALVGANNNG IEILRTSIGD DGSIVTGNRI ENIKAGPGGS GQYGNAINAF 
RAGNVIVSGN RIKNCDYSAV RGNSASNIHI TDNSVSDVRE VALYSEFAFE GAVISGNTVD 
GAALGVSVCN FNEGGRLSVV QGNIIRNLLP KRPIGTAPDD DAGIGIYVEA DTAVTGNVIE 
NAPSFGIVAG WGRYLRDVAI TGNVVRRAFV GIGVSVAEGA GTATINGNVI AEASRGAVVG 
LDHARPVTPD LTAPGAARFA QIALGSNSVR