Gene Rsph17029_2161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2161
Symbol
ID	4896222
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	2288920
End bp	2289942
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	73%
IMG OID	640112755
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_001044036
Protein GI	126462922
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.072502
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.073432
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCTCA GGGACAGCCA TGTGACGCTC GCCCACGGCG GCGGCGGGAA AGCCATGCGC 
GATCTGATCG AGGAGGTGTT CACGAGCCTC TTCCAGCCGC CGGGGATGGA GGATCAGGCG 
CGGCTGACCT CGGCGGCGCT GGCCGCGCCG GGCGCGCGGC TCGCGCTCAC CACCGACAGT 
TTCGTCGTGA CCCCGCTCGA ATTTCCCGGC GGCGACATCG GCAAGCTCGC CATCTGCGGC 
ACGGTCAACG ATCTCGCGGT GGGCGGGGCA GAGCCGCTCT GGCTCTCGGC CGCCTTCATC 
ATCGAGGAGG GCACCGAGAT CGCGCTGCTG CGCCGGATCG CGGCCACCAT GGCGGACGAG 
GCCCGGGCGG CCGGCGTGCG GATCGTGACG GGCGACACGA AGGTGGTGGA ACGTGGCGCG 
GCCGACGGGC TCTTCATCAC CACGACCGGC GTGGGCGTGA TCCCGCCCGG GCGCGAGCTG 
TCGGCCGCGG CGATCCGGCC GGGCGACCGG CTGCTCGTGA ACGGGGGCCT CGGCGATCAC 
GGCGCCACCA TCCTCGCCGC GCGCGGGGAT CTGGCGCTCT CGACCGATCT CCAGTCGGAC 
TGCGCCGCCC TCGGGCATCT GATGACGGCC GTGCTCAAGG CCGCTCCCGG TGCCCGGGCC 
GCACGGGATG CGACCCGCGG CGGGGTCGCG GCGGTGCTGA ACGAGATGGC CGAGGCCTCG 
GGCGTGGGGC TCGTCATCGA GGAGGAGGCG CTGCCGCTGC GGGCCGAGGT CGTGGGTCTT 
TGCGAGATCC TCGGCCTCGA TCCGCTTTAT CTCGCCAACG AGGGGCGGCT CGTGGTCGTG 
GTGCCGGAGG CGGAGGCCGA GGCGGCCCTC GGGGCCATGC GAGCCTGCCC CGAGGGCGCG 
GGCGCGGTGG CCATCGGCCG CGCGGTCGCG GACCATCCGG GGCAGGTGCG CATGACCACC 
CGCTTCGGCG GCAGCCGGAT CGTCGACATG CTGGTGGGCG AGCAACTGCC CCGCATTTGC 
TGA

Protein sequence

MALRDSHVTL AHGGGGKAMR DLIEEVFTSL FQPPGMEDQA RLTSAALAAP GARLALTTDS 
FVVTPLEFPG GDIGKLAICG TVNDLAVGGA EPLWLSAAFI IEEGTEIALL RRIAATMADE 
ARAAGVRIVT GDTKVVERGA ADGLFITTTG VGVIPPGREL SAAAIRPGDR LLVNGGLGDH 
GATILAARGD LALSTDLQSD CAALGHLMTA VLKAAPGARA ARDATRGGVA AVLNEMAEAS 
GVGLVIEEEA LPLRAEVVGL CEILGLDPLY LANEGRLVVV VPEAEAEAAL GAMRACPEGA 
GAVAIGRAVA DHPGQVRMTT RFGGSRIVDM LVGEQLPRIC