Gene RPD_1954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1954
Symbol
ID	4022436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	2193043
End bp	2195064
Gene Length	2022 bp
Protein Length	673 aa
Translation table	11
GC content	64%
IMG OID	637962147
Product	ATPase
Protein accession	YP_569090
Protein GI	91976431
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG5010] Flp pilus assembly protein TadD, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.342143
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.310254
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAATC TCGGCATCGC CATCTACGAC CCGCGTCGGC TCGATCCCGA AACCTTCCTC 
AAAGGTTTCG TGGCGCGGGG CGATTTCGTC GACTTCCTGC TCGACAAGCT TCGCCAGATG 
CCGGAGATCG GCGAGCATTT TCTGATCGTC GGCCCGCGCG GCATTGGCAA GACCAGCCTG 
CTGCGGCGTC TCGCGATCGG GATCTCGGAG GAGCCCGCCC TGCGCGCGCG CTTCATTCCG 
CTGAGTTTTC GCGAGGAGCA GTACAATGTC CGCGCGCTCG ATGCGTTCTG GAGAAACTGC 
GCCGAGTCGC TCGCCGAATG GTGCGAGGAT CAAGGCCGGC AGGAGATCGC CGACGATATC 
GACCGCAGCC TGCCGAGCGC GGAATGGCAT GAGTCGAACT CCGCGGTTCA GGCTTTCCTC 
GCTCTCTGCA AGCGGCTCGG CGGCCGGCCG GTGCTGTTCG TCGACAATCT CGATCTGATC 
CTCGACGCGC TGTCGCCGCA GCAGAACTGG GAGCTGCGGC GCACGCTGCA GGCACCCGGC 
GGACCGATCG TATTCGGCGC CGCCACGCAG ATGCTGCGGC AGAGCGCCGA CCGCGACGCG 
GCGTTCTACG AGTTCTTTCA CCCGCACATG TTGCATCCGC TCTCCGAAAG CGAGTTGCGG 
CACTGCATGT CCCGGCTGGC GCAGGCGCGC GGCGATTTGG GCAAGCCGGT CCTCGATGTG 
CTCGACCGCG AGCCGGAACG CATCCGCACG CTGCACAATC TGACCGGCGG CAATCCGCGG 
GTGCTGACGC TGGTCTATCA ATTGCTCGAG CGCACCGAGA GCGACAGCGT GTTCCGCGAT 
CTCGAAGTGC TGCTCGATCA GTTGACGCCC TATTACAAGG CGCGGGTCGA GGATTACCAG 
ACCGATCTGC AGCGCGCGGT GATCGACGCC ATCGCACTGC ACTGGCATCC GATCACGTCG 
AGCCGCCTGA GCGACATCAC CGCGGTCGAG GTCACCACGA TCTCGTCGCA GCTCAATCGG 
CTGAAGAATG ACGGGCTGAT CGAGGAGGTC GAGACTTCCG GCGCGCGCGC CGGCTATCAG 
CTCGTCGAGC GGTTCTTCAA CATCTGGTAT TTGATGCGAC ACGGCACCCG CCGTACCCGG 
CAGAAGATCG CCTGGCTGAC GGAGTTCTTG AGCAGTTTCT ATGCACCGGC CGAGCTGATG 
AAGATGAAGG CTGAGCTGAT CGCCGGCGGG AGCGCGTCGC TGCATCCGCT CTATCGCGAG 
GCGCTGGAGG CGGCCGGTGA GGAGAGTGGG AGGTTGGCGC GGGCTGCAGT GCCAGAGCCC 
TCTGTCGAGA CATCGCAATT GGGGAGGTCG AGCGATCTGT TTAGAGAGGC GGAGCACATT 
GTCCGCCATT GGGTCGAGCG CGATCAGACG AATTATGACG GTTGGTCCTT GCTCGGTAGT 
ATCCTTGCAG ACCATTCTGG ACATCCCGCC GAAGCTGAGG CTGCTTATCG GAAGGCAATG 
ACGATCTCCG GCGATCGAGT GATCGCAGAG GCCAATCTGG CGTGGCTACT TTTCGCCTCG 
GGTCGGTTGT CGGAAGCAGC CTCGCTCGAA TCCGCGCTGA CCAAGCTCGA TCCGGTCGGC 
CGCGCGCTGC TCGATGCGGC GCGCGCGCTC GTGCAAGACA ATTTCGGCGA CACGACGGGG 
CATTTGCAGC AGGCGTTGAA CAGCGATCTG GTGCAACTGA ACGCGACCTT CTCCGACGAT 
CTTCTCCGGC TGCTCCGGAT CGCGGCGCAG CGCGGCTATG GCGAGAAGCT GATCGAATGG 
TTCAACCAGT CCGGGCAGGC GGATCGGCGG GCGCCGGTCT ATGCGGCCCT CGTCGCTTTC 
GTGCGCGGCG AACGGTTCCT GCTGGACTTC AGCCCGGAGA TCCGTAAACC GGCCGAGTCG 
ATTTTCCGCT GGCTGAACTC GCGTTCGGAC AGATCCCCAT CAACTCCCGA CAAGCCCGCG 
CGGAAACGTG GCAGGCCGCC GCGCAAACGC CAGACCGCAT GA

Protein sequence

MSNLGIAIYD PRRLDPETFL KGFVARGDFV DFLLDKLRQM PEIGEHFLIV GPRGIGKTSL 
LRRLAIGISE EPALRARFIP LSFREEQYNV RALDAFWRNC AESLAEWCED QGRQEIADDI 
DRSLPSAEWH ESNSAVQAFL ALCKRLGGRP VLFVDNLDLI LDALSPQQNW ELRRTLQAPG 
GPIVFGAATQ MLRQSADRDA AFYEFFHPHM LHPLSESELR HCMSRLAQAR GDLGKPVLDV 
LDREPERIRT LHNLTGGNPR VLTLVYQLLE RTESDSVFRD LEVLLDQLTP YYKARVEDYQ 
TDLQRAVIDA IALHWHPITS SRLSDITAVE VTTISSQLNR LKNDGLIEEV ETSGARAGYQ 
LVERFFNIWY LMRHGTRRTR QKIAWLTEFL SSFYAPAELM KMKAELIAGG SASLHPLYRE 
ALEAAGEESG RLARAAVPEP SVETSQLGRS SDLFREAEHI VRHWVERDQT NYDGWSLLGS 
ILADHSGHPA EAEAAYRKAM TISGDRVIAE ANLAWLLFAS GRLSEAASLE SALTKLDPVG 
RALLDAARAL VQDNFGDTTG HLQQALNSDL VQLNATFSDD LLRLLRIAAQ RGYGEKLIEW 
FNQSGQADRR APVYAALVAF VRGERFLLDF SPEIRKPAES IFRWLNSRSD RSPSTPDKPA 
RKRGRPPRKR QTA