Gene Rcas_3796 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3796
Symbol
ID	5541298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4968093
End bp	4969208
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	62%
IMG OID	640895906
Product	hydrogenase expression/formation protein HypD
Protein accession	YP_001433853
Protein GI	156743724
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0409] Hydrogenase maturation factor
TIGRFAM ID	[TIGR00075] hydrogenase expression/formation protein HypD

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.44763
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.895026
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTACC TGGACGAATA TCGCGACCCG GATCTGGCGC AGCGGCTTTT TGCCGAGATT 
CGTCGCATCA CGACGCGCCC CTGGGCGATC ATGGAAGTGT GCGGCGGGCA GACGCATTCG 
ATTATCCGCA ACGGAATCGA TCAACTGTTG CCAGAAGCGA TTGAGCTGAT CCACGGTCCT 
GGCTGCCCGG TGTGCGTGAC GCCGCTGGAG ATTATCGACA AGGCGCTGGC AATCGCTTCC 
CGTCCCAACG TTATTTTCTG TTCGTTTGGC GATATGCTGC GCGTGCCGGG GAGTGCGAAA 
GACCTGTTCC GCGTCAAGAG CGAAGGCGGT GATGTGCGTG TGGTGTATTC ACCGCTCGAT 
GCCGTGCGCC TGGCGCAGCA GCACCCCGAC CGTGAGGTGG TCTTCTTTGG CATTGGTTTC 
GAGACGACTG CTCCCGCCAA CGCAATGGCA GTGTTGCAGG CGCACCGCCT GGGATTGCGC 
AATTTTTCGA TGCTGGTGTC GCACGTGCTG GTGCCACCCG CCATCTCCGC CATCATGGAG 
TCGCCGACGA ACCGTGTGCA AGGATTCCTG GCAGCCGGGC ATGTGTGCAG CGTGATGGGC 
ACCTGGCAGT ACCGGCCGCT GGTTGAACGG TACCATGTGC CAATTGTTGT CACCGGTTTC 
GAGCCGCTCG ACGTACTGGA AGGGATCCGC CGCGTCGTTC TGCAACTGGA AGCGGGACGC 
GCCGAACTCG ACAACGCCTA TGAGCGTGCC GTGCGACCGG AAGGGAACGT CGCGGCGCAA 
CAGGTGCTGT CTGAGGTCTT TGAGGTGACC GACCGGGCAT GGCGCGGCAT CGGCGTTATC 
CCGCAGAGCG GTTGGCGCCT GCGCAACGCC TACCGCGCCT ACGACGCCGA GGCGCGCTTC 
GCGGTTGGCG ACATTCAGAC GCGCGAGTCG CCAATCTGCC GCAGCGGTGA GGTGCTTCAG 
GGTATGCTCA AGCCCAATCA GTGCCCGGCG TTCGGCAAGG AATGCACCCC GCGCACGCCC 
CTTGGCGCAA CGATGGTGTC GAGCGAAGGG GCATGCGCTG CGTACTATCA GTACGGACGG 
TTCATCAAGG CTGAAGAGGT GGGAGTCGCG CGATGA

Protein sequence

MKYLDEYRDP DLAQRLFAEI RRITTRPWAI MEVCGGQTHS IIRNGIDQLL PEAIELIHGP 
GCPVCVTPLE IIDKALAIAS RPNVIFCSFG DMLRVPGSAK DLFRVKSEGG DVRVVYSPLD 
AVRLAQQHPD REVVFFGIGF ETTAPANAMA VLQAHRLGLR NFSMLVSHVL VPPAISAIME 
SPTNRVQGFL AAGHVCSVMG TWQYRPLVER YHVPIVVTGF EPLDVLEGIR RVVLQLEAGR 
AELDNAYERA VRPEGNVAAQ QVLSEVFEVT DRAWRGIGVI PQSGWRLRNA YRAYDAEARF 
AVGDIQTRES PICRSGEVLQ GMLKPNQCPA FGKECTPRTP LGATMVSSEG ACAAYYQYGR 
FIKAEEVGVA R