Gene Rcas_3795 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3795
Symbol
ID	5541297
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4967038
End bp	4968096
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	63%
IMG OID	640895905
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_001433852
Protein GI	156743723
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.717086
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.875312
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAAG GACTGAACTT CGAGGGATGG TCTTGTCCGT TGCCGTTGCG CGATCACCCG 
AACATCGTGA TGGGGCATGG CGGCGGCGGT AAACTCTCGG CGGAACTGGT CGAGCATCTG 
TTTCTGCCAG CATTTGCGGA TTCAGGTGCA GTCGATATGG GAGATGCGGC GCTCATTGCG 
GTTGGCGGGG CGCACCTGGC GTTTTCGACC GACTCGTTCG TCGTGCGGCC CCTCTTCTTT 
CCCGGTGGCA ACATCGGCGA ACTGGCGGTC AACGGCACGA TTAACGACAT CGCCATGCGC 
GGCGCGCAGC CGCTTGTCCT CAGCGCCGGA TTCATTCTGG AAGAAGGGCT GCCGCTCGAT 
CAACTCGCCG CAATTGCGCA CAGTATGGGT GTGGCTGCGC GCCGCGCCGG TGTCACCCTT 
GTGGCCGGTG ATACCAAAGT CGTCGATCGT GGGCATGGCG ACGGCGTCTA TATCAACACC 
AGCGGCTTTG GCATTGTGCC GGAGGGGATC GACATTGGAC CGACGCGGGC GCAACCGGGG 
GATGCGATCA TCGTCAGCGG CACGATTGGC GATCACGGCA TTGCCATTCT CAGCGTGCGC 
GAAGGGCTTG AGTTTGGCGC AACCGTCGAA TCCGACACTG CGCCGCTCAA CGGGCTGGTC 
GCCGATCTGC TGGACGAAAC GCGCAATATC CACGTCCTGC GTGATCCGAC GCGCGGCGGA 
GTGGCGTCGG CGCTCAACGA AATCGCGCGT GCCTCACAGG TCGGTATTGT GATCGACGAG 
CGTAACCTGC CGGTGCAGGA CGCTGTGCGC GCTGCATGCG AATTGCTCGG CATGGACCCG 
CTCTATGTGG CGAACGAGGG GAAACTGATT GCGATTGCGC CTGCTTCCGA CGCCGAACGC 
CTGTTGGCGC GCATGCGCGC GCATCCGTTG GGACGGCAGG CCGCCATCAT TGGGCGTGTC 
ACCGCTGACC ATCCGGGGTT GGTGGCGGCG CGCACCGGCA TTGGCGGGAC GCGCATTGTC 
GATATGATGG TTGGCGAACA GTTGCCGCGG ATTTGCTGA

Protein sequence

MSEGLNFEGW SCPLPLRDHP NIVMGHGGGG KLSAELVEHL FLPAFADSGA VDMGDAALIA 
VGGAHLAFST DSFVVRPLFF PGGNIGELAV NGTINDIAMR GAQPLVLSAG FILEEGLPLD 
QLAAIAHSMG VAARRAGVTL VAGDTKVVDR GHGDGVYINT SGFGIVPEGI DIGPTRAQPG 
DAIIVSGTIG DHGIAILSVR EGLEFGATVE SDTAPLNGLV ADLLDETRNI HVLRDPTRGG 
VASALNEIAR ASQVGIVIDE RNLPVQDAVR AACELLGMDP LYVANEGKLI AIAPASDAER 
LLARMRAHPL GRQAAIIGRV TADHPGLVAA RTGIGGTRIV DMMVGEQLPR IC