Gene RPD_3522 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3522
Symbol
ID	4024036
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3910043
End bp	3911320
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	65%
IMG OID	637963726
Product	putative pilus assembly protein cpaE
Protein accession	YP_570646
Protein GI	91977987
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4963] Flp pilus assembly protein, ATPase CpaE
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.257718
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAGCT ACGCACGCCA GAACCAGGAA GAGCCCGCGG CCGGCGCCTC GTCGTCCGCC 
ACGACGCAGG ACGAGCACAT CGCGCCGGCG CCGCGTGTAT CAGTGCAGGC GTTCTGCGAA 
TCGGTCGAGA CCGCGGCGGC CGTGCAGGCC GCCGGCGAAG ACCGCCGTCT CACCAAGGCG 
CATCTGAAGA TCCAGATGGG CGGCATGATC GCGGCGATCG AAGCCTATCG CTCGGCGCCG 
ACCCCGAACG TCATCATCCT CGAGACCGAT CCGCGCAACG ACGTGCTCGC CGGCCTCGAT 
CAGCTCGCCA CGGTCTGCGA TCCGGGCACC CGCGTCATCG TGATCGGCAA GGTCAACGAC 
GTCACGCTGT ATCGCGAGCT AGTTCGTCGC GGCGTCAGCG ACTACGCGAT CGCGCCGGTC 
GATCCGATCG ACGTCGTGCG CTCGATCTGC AATCTGTTTT CGGCACCGGA AGCCAAGGCC 
GTCGGCCGCA TCATCGCGAT CGTCGGCGCC AAGGGCGGTG TCGGCGCCTC CACCATCGCG 
CACAACGTCG CCTGGGCGAT CGCCCGCGAT CTGGCGCTCG ACTCGGTCGT CGCCGACCTC 
GACCTCGCTT TCGGCACCGC CGGCCTCGAC TACAACCAGG ACCCGCCGCA AGGCATCGCC 
GAGGCGGTGT TCTCGCCGGA CCGCGTCGAC ACCGCCTTCG TCGATCGTCT GCTGTCGAAA 
TGCACCGATC ATCTCAGCCT GCTGGCCGCG CCGGCGACGC TCGATCGGGT CTATGATTTC 
GGCGCCGACG CGTTCGACTC GATCTTCGAC ACGCTTCGCG CGACGATGCC CTGCATCGTG 
CTCGACGTGC CGCATCAATG GACCGGTTGG GCGAAACGCG CGCTGATCAA TGCCGACGAC 
ATCCTGATCG TCGCCGCGCC TGACCTCGCC AATTTGCGCA ATGCCAAGAA TCTGTACGAT 
CTGCTGAAGG CGTCGCGGCC GAACGATCGA CCGCCGTTAT ACTGCCTGAA CCAGGTCGGC 
GTGCCGAAGC GGCCCGAGAT CAATGCGAGC GAGTTCGCCA AGGCGATCGA GAGCCAGCCG 
ATCGTCAGCA TCCCGTTCGA TCCGCAGATG TTCGGTTCGG CCGCCAATAA CGGGCAGATG 
ATCGCGGAGA TCGCGGCGTC TCACAAGACC ACCGAGATGT TCCTGCAGAT CGCCCAGCGA 
CTGACGGGAC GCGGTGAAGC CAAGAAGCCG AAAGGCGGCT TCCTGTCGCC GATTCTGGAG 
AAGCTGCGGG CCAGATAA

Protein sequence

MISYARQNQE EPAAGASSSA TTQDEHIAPA PRVSVQAFCE SVETAAAVQA AGEDRRLTKA 
HLKIQMGGMI AAIEAYRSAP TPNVIILETD PRNDVLAGLD QLATVCDPGT RVIVIGKVND 
VTLYRELVRR GVSDYAIAPV DPIDVVRSIC NLFSAPEAKA VGRIIAIVGA KGGVGASTIA 
HNVAWAIARD LALDSVVADL DLAFGTAGLD YNQDPPQGIA EAVFSPDRVD TAFVDRLLSK 
CTDHLSLLAA PATLDRVYDF GADAFDSIFD TLRATMPCIV LDVPHQWTGW AKRALINADD 
ILIVAAPDLA NLRNAKNLYD LLKASRPNDR PPLYCLNQVG VPKRPEINAS EFAKAIESQP 
IVSIPFDPQM FGSAANNGQM IAEIAASHKT TEMFLQIAQR LTGRGEAKKP KGGFLSPILE 
KLRAR