Gene RPC_3758 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3758
Symbol
ID	3969351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	4182186
End bp	4183232
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	68%
IMG OID	637926868
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_533612
Protein GI	90425242
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCGC GCCAGCGTCA CCGCAAGCTC GATCTCGTGG CCGGCCGGGT CGAGCTGTCG 
CACGGCGCCG GCGGTCGCGC CATGGCGCAG CTGATCGCGG AGGTGTTTCA CGCAGCCCTC 
GACAACGACT GGCTGCGCCG CGGCAACGAT CAGTCGGCGT TCGACGTCGA GGCCGGCCGC 
ATGGTGATGA CCACCGACGG CTATGTGATC TCGCCGTTGT TTTTTCCCGG CGGCGACATC 
GGCTCGCTTT CGGTGCACGG CACCATCAAC GACGTGGCGA TGGCCGGGGC AAAGCCGCTG 
TATCTGTCGG CGAGTTTTAT TATCGAAGAG GGGTTTCCGC TCGCGGACTT GAATCGCATC 
GCCGACAGCA TGGGGCAAGC GTCGCGCGAG GCTGGTGTGC CGGTGATCAC CGGCGACACC 
AAGGTGGTGG AGCGCGGCAA GGCCGACGGC GTGTTTATCT CCACCGCCGG CGTCGGCGTG 
CTGCCGCACG GCCTCGAGCT CTCCGCCGAC AAAGCGCGGC CCGGCGACAA GCTGCTGCTG 
TCCGGCTCGC TCGGCGATCA CGGCGTCGCG GTGATGTCGC GGCGGCAGAA TCTGGCCTTC 
GACACCAACA TCGTGTCGGA CTCCGCGGCG CTGCACGGTC TCGTCGCCGA CATGGTCGCG 
GTGGCTGGGG CTAGCCTGCG GGTGATGCGC GATCCGACCC GCGGCGGGCT CGCCGCGACG 
CTGAATGAAC TGGCGCAGCA ATCCCGCGTC GGCTTCCGCA TCGACGAGGA CAATCTCCCG 
ATCAAGCCGC AGGTCGCCGC CGCCTGCGAA TTGCTGGGCC TCGATCCGCT CTACGTCGCC 
AACGAGGGCA AGCTGGTTGC GATCGTCGCA CCCGACGCCG CCGAGGCGGC GCTCTCGGCG 
ATGCGCCGGC ATCCGTTGGG GCGCGAGGCT ACTATCATTG GCGAGGCGGT TGAGGACGAG 
CATCGCTTCG TGCAGATGAC CACCGCGTTC GGCGGCGGCC GCATCGTCGA TTGGCTGGCG 
GGCGATCAAT TGCCACGGAT CTGTTGA

Protein sequence

MSARQRHRKL DLVAGRVELS HGAGGRAMAQ LIAEVFHAAL DNDWLRRGND QSAFDVEAGR 
MVMTTDGYVI SPLFFPGGDI GSLSVHGTIN DVAMAGAKPL YLSASFIIEE GFPLADLNRI 
ADSMGQASRE AGVPVITGDT KVVERGKADG VFISTAGVGV LPHGLELSAD KARPGDKLLL 
SGSLGDHGVA VMSRRQNLAF DTNIVSDSAA LHGLVADMVA VAGASLRVMR DPTRGGLAAT 
LNELAQQSRV GFRIDEDNLP IKPQVAAACE LLGLDPLYVA NEGKLVAIVA PDAAEAALSA 
MRRHPLGREA TIIGEAVEDE HRFVQMTTAF GGGRIVDWLA GDQLPRIC