Gene RPC_3759 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3759
Symbol
ID	3969352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	4183229
End bp	4184359
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	67%
IMG OID	637926869
Product	hydrogenase expression/formation protein HypD
Protein accession	YP_533613
Protein GI	90425243
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0409] Hydrogenase maturation factor
TIGRFAM ID	[TIGR00075] hydrogenase expression/formation protein HypD

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATATG TCGACGAGTA TCGCGACGGC CAACTCGCCC GAGGCCTCGC CGCCACCATC 
GCCCGCGACA GCGATCCCGC GCGCAACTAC GCGCTGATGG AATTCTGCGG CGGCCACACC 
CACGCGATCT CGCGCTACGG CCTCGAGGAT CTGTTGCCGG GCAACGTTCG CATGGTGCAC 
GGTCCCGGCT GCCCGGTCTG CGTGCTGCCG ATCGGCCGCA TCGACATGGC GCTGCAGCTC 
GCGACCCGGC CGAACGTGAC GCTGTGTTGT TACGGCGACC TGATGCGGGT GCCGGGCTCG 
CGTGGCAACT CGCTGCTGCG CGCCAAGGCG GCGGGCGCCG ACATCCGCAT GGTGTATTCG 
ACGCTCGATG CGCTCGCGCT CGCCGAGGCC GAGCCGTCGC GCGACGTGGT GTTCTTCGCC 
ATCGGTTTCG AGACCACCAC GCCGCCGACC GCGCTGGCGG TCCGGCTGGC GCAGAAGCGG 
GGCCTCACCA ATTTCAGCGT GTTCTGCAAC CACGTGCTGA CGCCGTCGGC GATCCAGCGG 
ATTCTCGCTT GCGACAGCGA CGGTGTGCAC ATCGATGGCC TGGTCGGTCC GGCGCATGTC 
TCCACCGTGA TCGGCACCGC GCCGTTCTCA CGCTTCGCAA CCGAGTTCGC CAAGCCGGTG 
GTGGTGGCGG GCTTCGAGCC GCTCGACGTG ATGCAGGCGA TATTGATGCT GATCCGCCAG 
GTCAATGACG GCCGCGCCGA GGTGGAAAAC CAGTACATCC GCGCGGTGAC GCCCGACGGC 
AACCGGATCG CGCAGGGCGA AGTCGCGGAT ATCTTCGAAT TGCGTGAGAG TTTCGAGTGG 
CGCGGGCTCG GCCAGATCCC CGCCAGCGCG CTGCGCTTGA AACCAGCCTA TGCCGGCTTC 
GACGCCGAGC GGCGCTTTGC GCTCGACGAT ATGTCCGCCA GTGACAACCC GGCCTGCGAA 
TGCGGCGCCA TCCTGCGCGG CGTCAAGCGC CCCGCCGAAT GCCGATTGTT CGGCAAAGCA 
TGCACGCCGG AGAGTCCAAT GGGCTCCTGC ATGGTGTCGT CGGAAGGCGC CTGCGCGGCG 
CATTGGAGCT ATGGCCGGTT TCGCGACCAC GCCCGGAGGA AAACCGCATG A

Protein sequence

MKYVDEYRDG QLARGLAATI ARDSDPARNY ALMEFCGGHT HAISRYGLED LLPGNVRMVH 
GPGCPVCVLP IGRIDMALQL ATRPNVTLCC YGDLMRVPGS RGNSLLRAKA AGADIRMVYS 
TLDALALAEA EPSRDVVFFA IGFETTTPPT ALAVRLAQKR GLTNFSVFCN HVLTPSAIQR 
ILACDSDGVH IDGLVGPAHV STVIGTAPFS RFATEFAKPV VVAGFEPLDV MQAILMLIRQ 
VNDGRAEVEN QYIRAVTPDG NRIAQGEVAD IFELRESFEW RGLGQIPASA LRLKPAYAGF 
DAERRFALDD MSASDNPACE CGAILRGVKR PAECRLFGKA CTPESPMGSC MVSSEGACAA 
HWSYGRFRDH ARRKTA