Gene RPB_0761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0761
Symbol
ID	3909249
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	854506
End bp	856185
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	66%
IMG OID	637882653
Product	flagellar hook-associated protein
Protein accession	YP_484383
Protein GI	86747887
COG category	[N] Cell motility
COG ID	[COG1345] Flagellar capping protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACCG TCACCAGTTC GACTTCCGCC TCGGCGACGG CCGCGCTCGC GACCACGACG 
TCCGGCACCA CGACCACGAC GAGCGTCGAT TGGGATGCGT TGATCGAAGC GCAGGTGGCG 
ACCAAGACCG CCGCCGCCGA CACCATCGAG ACCAGCATCA CGGCCAACGA AGCCAAGATC 
TCGGCCTACC AAAATCTGCA GACGCTGCTC GACACGCTCG TGACCAGCAC CACCTCGCTG 
TCGAAGTCGA TCGTCAACTC GCTGTCCGAC AGCACCTTCG GCGCCCGCGC GGCCACGATC 
ACCTCGAGCG GCGACGTCAG CGCCAGCTCC GCGGTGTCGA TGTCGATCAG CAACGGCGCC 
GCCACCGGCG ACCATACGCT CACGGTCGAG CAGATCGCCA CCGCGCACCG CGTGATCGGA 
ACCAGCGTCG CGGACAAATC CGCGGATATG GGCCTGACCG GCGTGTTCTC GCTCGGCCTG 
GCCGGCGGCA CCAGCGTCGA CGTCTCGATC ACCAGCGGCA TGTCGATGGA AGACATCGCC 
GACACCATCA ATGCGCAGAG CGACAGCACC AACGTCCAGG CCTCGATCAT CCAGATCTCG 
AGCACCGAAT ACGCGCTGAC GCTGACCGCG CTGAACGACA ACGCCGAGAT CACCACCAGC 
GTCGTCTCCG GCGACGACGT GCTGACGACG CTCGGCGTCA CCGATTCCGC CGGCGACTTC 
ACCGACGTGC TGCAGGAGCC GCAGCCGGCG CTGTTCACGG TCGACGGCAT CTCGCTGACC 
CGCGACACCA ACGACATCAC CGACGTGCTG AGCGGCGTGA CCTTCAGCCT GCTGCAGGCG 
ACGCCGGACG GCTCGACCAT CAATCTCAGC ATCGACGTCG ACGCCGACCA GATCGCGGCC 
GCGCTGGAGG AGTTCGTCAC CGCCTACAAC GCCGTCCGCG AGGAGGTCAC CGCGCAGCAG 
ACGCTGACCT CGGACGGGAC CGCGGATTCC AGCGCCGTGC TGTTCGGCGA CGGCACCATG 
CGCAGCATCA TGACGCAGAT CGAACAGGCG ATGAACTCCA CCGTCGGCGG ACTGTCGATG 
ACCGACCTCG GGCTGTCGTT CACCGACACC AATACGCTCG AGTTCGACAC CAGCGTGCTG 
TCGGCCACGC TGACCGAAGA CCTCTCGGGC GTGATCGCTC TGCTGGCGTC GAAGACGACG 
GCGTCGTCGA GCTCGCTCTC GGTGGTCAAT ACCAACTCGT CGCCGCCGTC GTCCTTCGTG 
CTCGACATCG CGGTCGACGA TTCCGGCGCC CTGACGGTGT CGGTCGGCGG CGACAGCTCG 
CTGTTCACCG TCAGCGGCAA CACCATCATC GGCGCCTCCG GCACGGTGTA TTCCGGCATG 
GCCTTCACCT ATTCGGGCTC CAGCTCGGCG TCGATCACCG TGACCTCGAC CTCCGGCATC 
GCGGCGCAGA TCAACAACAT CGCCGACCTC GCCTCCGACA CCAGCACGGG GTCGCTGCAG 
GATCTGGTCA CCAGCCTGCA ATCGCAGGAC GACCGGATGG AGCAGCAGAT CAACGACATC 
AACGAGCGGG CCGAAATCTA CCGCGCGATG CTGGTCAGCC AATACGCCAA ATACCAGAGC 
GCGATCTCCA CGGCGGACAC CACGCTCGAC TATCTCTCCG CTCTCCTCAA CGACGAGTAA

Protein sequence

MATVTSSTSA SATAALATTT SGTTTTTSVD WDALIEAQVA TKTAAADTIE TSITANEAKI 
SAYQNLQTLL DTLVTSTTSL SKSIVNSLSD STFGARAATI TSSGDVSASS AVSMSISNGA 
ATGDHTLTVE QIATAHRVIG TSVADKSADM GLTGVFSLGL AGGTSVDVSI TSGMSMEDIA 
DTINAQSDST NVQASIIQIS STEYALTLTA LNDNAEITTS VVSGDDVLTT LGVTDSAGDF 
TDVLQEPQPA LFTVDGISLT RDTNDITDVL SGVTFSLLQA TPDGSTINLS IDVDADQIAA 
ALEEFVTAYN AVREEVTAQQ TLTSDGTADS SAVLFGDGTM RSIMTQIEQA MNSTVGGLSM 
TDLGLSFTDT NTLEFDTSVL SATLTEDLSG VIALLASKTT ASSSSLSVVN TNSSPPSSFV 
LDIAVDDSGA LTVSVGGDSS LFTVSGNTII GASGTVYSGM AFTYSGSSSA SITVTSTSGI 
AAQINNIADL ASDTSTGSLQ DLVTSLQSQD DRMEQQINDI NERAEIYRAM LVSQYAKYQS 
AISTADTTLD YLSALLNDE