Gene Dret_1077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1077
Symbol
ID	8418902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	1268647
End bp	1269657
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	59%
IMG OID	645037649
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_003197943
Protein GI	258405201
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.26154
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.1511
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTTTC CAGATACTGT GCTCCTTGAT TACGGCAGCG GGGGCAAAGC CTCCCAGCGG 
CTTATCAGCG AACTTTTTTT GAAACATTTT GACAATGCCA CCCTCAACCG GCTGGATGAC 
GCGGCAATGC TGGACCTCAG CGGACCGCTT GCCGTGAGTA CCGACAGTTT TACCGTGGAC 
CCGTTGTTCT TTCCTGGTGG TGATATCGGC TCTCTTGCCA TCCACGGCAC GGTCAATGAC 
GTGGCCATGC TCGGGGCGCG GCCGATGTAT CTCAGTTGCG CGATGATCGT GGAAGAGGGA 
TTGCCGTTTT CCACTTTGGA AGCCGTGGTT CGGTCTATGG CTGAAGCGTC CCGACATGCC 
GGGGCCCAGA TCGTTACCGG GGACACCAAG GTCGTCCCCA AAGGGGCTGT GGATAAGCTT 
TTTATCAATA CGACCGGGTT GGGACTGGTC CAGACGGCTT CCCCGCCCCA GGGCGACAGG 
GCCCGCCCAG GCGACGCGAT CCTGCTGACC GGGACAATGG GTGACCACGG TCTGACGATT 
TTAAGCCAGC GCCAGGGACT GGAATTCGAG ACTCCGGTGC AAAGCGATAG CGCCGCACTC 
AATCATATGC TGCTTGATCT GGTTGAATCG GTGGGAGAAG TCCATGTCTT GCGCGACCCG 
ACGCGCGGCG GCCTGGCGAC CACACTCAAC GAGATCGCAC TCCAATCCAA TCTGGGATTC 
GTGATAGAGG AAAAGGCGGT TCCGGTCTCG GATGCGGTGC GTTCCGGTTG CTCGTTTCTG 
GGACTTGACC CCTTGTATCT GGCCAATGAG GGCAAGGCCA TCTGCATTGT CCCTGAAGAT 
CGCTTGGATG CGGCCTTGGC TTGCCTTCGC TCCCACGACG AAGGCCGCCA GGCCTGCCGA 
GTCGGCACGG TGACCGAAGA CCATCCTGGA AAGGTGGTCT TGCAGACCCC GATCGGCGGC 
AAACGCTTGC TGGATATGCT TGAAGGAGAG CAATTACCGA GGATTTGCTG A

Protein sequence

MSFPDTVLLD YGSGGKASQR LISELFLKHF DNATLNRLDD AAMLDLSGPL AVSTDSFTVD 
PLFFPGGDIG SLAIHGTVND VAMLGARPMY LSCAMIVEEG LPFSTLEAVV RSMAEASRHA 
GAQIVTGDTK VVPKGAVDKL FINTTGLGLV QTASPPQGDR ARPGDAILLT GTMGDHGLTI 
LSQRQGLEFE TPVQSDSAAL NHMLLDLVES VGEVHVLRDP TRGGLATTLN EIALQSNLGF 
VIEEKAVPVS DAVRSGCSFL GLDPLYLANE GKAICIVPED RLDAALACLR SHDEGRQACR 
VGTVTEDHPG KVVLQTPIGG KRLLDMLEGE QLPRIC