Gene Elen_3074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_3074
Symbol
ID	8417409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	3574207
End bp	3575229
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	69%
IMG OID	645026054
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_003183406
Protein GI	257792800
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000468886
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATACCA CGGTCATGCT GGGGCACGGC AGCGGCGGGA CGATGATGAA GCGCATCATC 
GACGATGTGT TCTTCGCCGC GTACGCCGGC GACGAGCTGC TGCGCGGCGA CGACGCGGCG 
GTGCTGCCCG CGCCCGCTCC GGGCGAGCGG CTGGCGTTCT CCACCGACAG CTTCGTGGTG 
ACGCCGCATT TCTTCCCGGG CGGCGACATC GGACGCCTCG CCGTGTGCGG CACGGTGAAC 
GACGTGGCCA CGAGCGGCGC CGTGCCGCGC TACCTCAGCT GCGGCTTCGT GCTGGAGGAG 
GGCTTCCCCA TTGAGGATCT CAAGCGCATC TGCGCCTCCA TGGCGGAATG CGCGCAGGAG 
GCCGGCGTGC ATCTGGTCAC CGGCGACACG AAAGTGGTGA ACCGCGGCCA CGGCGACGGC 
GTGTACATCA ACACGAGCGG CGTGGGCACC ATTCCCGAAG GCGTGAACCT GGGTGGCGCG 
CAGTGCAAGC CGGGCGACAA AGTGCTGGTC ACCGGCACGC TGGGTGATCA CGGCATCACC 
ATCATGAGCT GCCGCGAGAG CTTGAGCTTC TCGGCCGATC TGGAAAGCGA CGCGGCCCCG 
CTCAACCACC TCATCGCCGA GGTGTTGGCG GCGGCGCCGA ACACGCGCTG CTTCCGCGAC 
CCGACGCGCG GCGGCCTGGC CTCCACGCTG AACGAGCTGG CTGCCCAGTC GAACACGGAC 
ATCACGGTGG AGGAAGACGC CATCCCCGTG AAGCCGGCCG TGCAGGGCGC GTGCGAGATG 
CTGGGCTACG ACGTGCTGCA GGTGGCGAAC GAGGGCAAGA TGGTGTGCGT TGTGGCGGCC 
GAGGAGGCCG ACGCAGCGCT CGCGGCCATG CGCGCGAACC GGTACGGCGC CGATGCGGCC 
ATCATCGGCG AGGTGTCGGC CGCCCGTCCC GAGCGCGGCT CCAAGGTGTT CCTGCGCACG 
GCGTTCGGCG GTACGCGCAT CCTCGACATG CTGGTGGGCG AGCAATTGCC GCGCATTTGC 
TAG

Protein sequence

MDTTVMLGHG SGGTMMKRII DDVFFAAYAG DELLRGDDAA VLPAPAPGER LAFSTDSFVV 
TPHFFPGGDI GRLAVCGTVN DVATSGAVPR YLSCGFVLEE GFPIEDLKRI CASMAECAQE 
AGVHLVTGDT KVVNRGHGDG VYINTSGVGT IPEGVNLGGA QCKPGDKVLV TGTLGDHGIT 
IMSCRESLSF SADLESDAAP LNHLIAEVLA AAPNTRCFRD PTRGGLASTL NELAAQSNTD 
ITVEEDAIPV KPAVQGACEM LGYDVLQVAN EGKMVCVVAA EEADAALAAM RANRYGADAA 
IIGEVSAARP ERGSKVFLRT AFGGTRILDM LVGEQLPRIC