Gene RPD_3520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3520
Symbol
ID	4024034
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3907853
End bp	3909295
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	65%
IMG OID	637963724
Product	type II and III secretion system protein
Protein accession	YP_570644
Protein GI	91977985
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4964] Flp pilus assembly protein, secretin CpaC
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.637726
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTACG GCGCCAATCA CCGATTCATC CGGACTCTGA AGGGCACGGC GATGGCGTTG 
TCCGCCGTCG TCGCGCTGAC GCTGTTTCCG ACCTTGGCGC CGGTGCAGGC CAGCGACTAT 
CGCGACACGC CGGCTCGGAT GGGCAACTCC GGCCTCAATG CGCGGCCGCT CGCGCTCGGC 
ATCGGCAAGT CGGTCGTGAT CGATCTGCCG CGCGACATCA AGGATGTGCT CGTCGCCGAT 
CCGAAGATCG CCAACGCGGT GGTGCGTTCG GCGCAGCGCG CCTACATCAT CGGCGCCGCC 
GTCGGCCAGA CCAACATCGT GTTCTTCGAC TCCACCGGCC AGCAGATCGC CGCCTACGAC 
ATCGCGGTGA CCCGCGACCT CAACGGCATC CGCACCGCGC TGCGGCAGTC GATCCCCAAT 
GCGGACATCC AGGTCGAGGG CCTCGGCGAC GGCGTGATGC TGATAGGGTC GGTGGCGACA 
CCGATCGAGG CGCAGCAGGC CGCCGATCTC GCCGCGCGGC TGGCAGGTGA CGCGAGCAAA 
GTCGTTAACA ACATCGCGGT CCGCGGCCGC GACCAGGTGA TGCTGAAGAT CACCGTGGCC 
GAGGTGCAGC GCGACATCGT CAAGCAGCTC GGCGTCGATC TCACCGCCAG CATGAACTAC 
GGCACCTCCG TGGTGAAGTT CAGCAACACC AATCCGTTCA CCCAGTCCGG TGGGCCGCTG 
GTGGCGAACA ACGCGCTGAC GACATCGTTC GGCTCGGGGC CGTCAGTGTC AGCGACGCTG 
CGCGCGATGG AGAGCGCCGG GGTCGTGCGG ACGCTGGCCG AACCGAACCT CACGGCGATC 
TCCGGCGAAC CGGCGAGCTT CCTCGCCGGC GGCGAGTTTC CCGTTCCAAG CGGCGTAACC 
TGCACCAACA GCCTTTGCAC GCCGTCGGTG ACGTTCAAGA AGTTCGGTGT TCTGCTCAAC 
TTTACCCCGG TGGTTTTGAC CGAGGGCCGG ATCAGCCTGA AGGTCTCGAC CGAAGTCTCC 
GAGGTCTCGA GCGACAACTC GATCGTCATC GGCGGCCTGT CGGTGCCCTC GATCAAGACC 
CGCCGTATCG AAAGCACGGT GGAAATCCCG TCCGGCGGTT CGCTGGCGAT GGCAGGTTTG 
ATCCAGGAAC AGACCAAGCA GGCGATCAAC GGCCTGCCCG GCATGACCCA ACTCCCGATC 
CTCGGCACCC TGTTCCGCAG CCGCGACTAC ATCAACCGGC AGACCGAACT GATGGTGATG 
GTGACGCCCT ATGTGGTGCG TGCTGTGGCG CAGAAGGATC TGTCGCGGCC CGACGACGGC 
TTCGCCGACG CCTCCGATCC ACAGTCGGAT CTGCTCGGCA ATATCAACCG GATCTACGGC 
GTCCCCGGAC GCACCGGGCC CGCACAAACC TACCGGGGCC GGTTCGGCTT TATCACCGAC 
TGA

Protein sequence

MSYGANHRFI RTLKGTAMAL SAVVALTLFP TLAPVQASDY RDTPARMGNS GLNARPLALG 
IGKSVVIDLP RDIKDVLVAD PKIANAVVRS AQRAYIIGAA VGQTNIVFFD STGQQIAAYD 
IAVTRDLNGI RTALRQSIPN ADIQVEGLGD GVMLIGSVAT PIEAQQAADL AARLAGDASK 
VVNNIAVRGR DQVMLKITVA EVQRDIVKQL GVDLTASMNY GTSVVKFSNT NPFTQSGGPL 
VANNALTTSF GSGPSVSATL RAMESAGVVR TLAEPNLTAI SGEPASFLAG GEFPVPSGVT 
CTNSLCTPSV TFKKFGVLLN FTPVVLTEGR ISLKVSTEVS EVSSDNSIVI GGLSVPSIKT 
RRIESTVEIP SGGSLAMAGL IQEQTKQAIN GLPGMTQLPI LGTLFRSRDY INRQTELMVM 
VTPYVVRAVA QKDLSRPDDG FADASDPQSD LLGNINRIYG VPGRTGPAQT YRGRFGFITD