Gene ECD_02571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_02571
Symbol	hycE
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	2684729
End bp	2686438
Gene Length	1710 bp
Protein Length	569 aa
Translation table	11
GC content	57%
IMG OID
Product	hydrogenase 3, large subunit
Protein accession	ACT44390
Protein GI	253978720
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.671666
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGAAG AAAAATTAGG TCAACATTAT CTCGCCGCGC TGAATGAGGC ATTTCCGGGC 
GTCGTGCTGG ACCACGCCTG GCAGACCAAA GATCAGCTGA CTGTCACCGT AAAGGTGAAC 
TACCTGCCGG AAGTGGTGGA GTTTCTTTAC TACAAACAGG GTGGCTGGCT GTCGGTGCTG 
TTTGGTAACG ACGAACGCAA ACTGAATGGT CATTACGCCG TTTACTACGT GCTGTCGATG 
GAGAAGGGCA CTAAGTGTTG GATTACGGTT CGCGTCGAAG TTGACGCCAA CAAACCGGAA 
TATCCGTCCG TGACACCGCG CGTTCCGGCG GCGGTGTGGG GCGAGCGCGA AGTGCGCGAT 
ATGTACGGTT TGATTCCGGT TGGTCTGCCG GATGAACGCC GTCTGGTGCT GCCGGATGAC 
TGGCCGGATG AACTTTATCC GCTGCGTAAA GACAGCATGG ATTATCGTCA GCGTCCGGCG 
CCGACCACCG ATGCTGAAAC CTACGAGTTC ATCAACGAAC TGGGCGACAA GAAAAACAAC 
GTCGTGCCGA TTGGTCCGCT GCACGTCACT TCTGATGAAC CGGGCCACTT CCGTCTGTTC 
GTCGATGGCG AAAACATTAT CGACGCCGAC TACCGCCTGT TCTATGTCCA TCGCGGTATG 
GAAAAACTGG CGGAAACCCG CATGGGTTAT AACGAAGTGA CCTTCCTCTC TGACCGTGTG 
TGCGGGATCT GCGGCTTTGC TCACAGCACC GCCTACACCA CGTCGGTGGA AAACGCGATG 
GGTATTCAGG TGCCAGAACG TGCGCAGATG ATCCGCGCCA TTCTGCTGGA GGTGGAACGC 
CTGCACTCGC ATCTGCTCAA CCTCGGCCTC GCCTGCCACT TTACCGGCTT CGACTCCGGC 
TTTATGCAGT TCTTCCGCGT GCGTGAAACC TCCATGAAAA TGGCAGAGAT CCTTACCGGT 
GCGCGTAAAA CCTACGGCCT GAACCTGATC GGCGGGATTC GTCGCGATCT GCTGAAAGAT 
GACATGATCC AGACCCGTCA ACTGGCGCAA CAGATGCGTC GTGAAGTGCA GGAGCTGGTG 
GATGTGCTGC TGAGTACGCC GAACATGGAA CAGCGCACTG TCGGCATTGG TCGTCTGGAC 
CCGGAAATCG CTCGCGACTT CAGTAACGTT GGCCCGATGG TCCGCGCCAG CGGTCACGCC 
CGCGATACCC GCGCCGATCA CCCATTTGTC GGCTATGGCC TGCTGCCAAT GGAAGTCCAC 
AGCGAGCAGG GCTGCGACGT TATTTCCCGT CTGAAAGTGC GTATCAACGA AGTCTATACC 
GCGCTGAACA TGATCGACTA CGGTCTGGAT AACCTGCCGG GTGGCCCACT GATGGTGGAA 
GGCTTTACCT ACATTCCGCA CCGCTTTGCG CTGGGCTTTG CCGAAGCGCC GCGCGGCGAT 
GATATCCACT GGAGCATGAC CGGCGACAAC CAGAAGCTGT ACCGCTGGCG CTGCCGTGCC 
GCGACCTACG CGAACTGGCC GACCCTGCGC TACATGCTGC GCGGAAACAC CGTTTCCGAT 
GCGCCGCTGA TTATCGGTAG CCTCGACCCT TGCTACTCCT GTACCGACCG CATGACCGTG 
GTCGATGTGC GTAAGAAAAA GAGCAAAGTG GTGCCGTACA AAGAACTCGA GCGTTACAGC 
ATTGAGCGTA AAAACTCGCC GCTGAAATAA

Protein sequence

MSEEKLGQHY LAALNEAFPG VVLDHAWQTK DQLTVTVKVN YLPEVVEFLY YKQGGWLSVL 
FGNDERKLNG HYAVYYVLSM EKGTKCWITV RVEVDANKPE YPSVTPRVPA AVWGEREVRD 
MYGLIPVGLP DERRLVLPDD WPDELYPLRK DSMDYRQRPA PTTDAETYEF INELGDKKNN 
VVPIGPLHVT SDEPGHFRLF VDGENIIDAD YRLFYVHRGM EKLAETRMGY NEVTFLSDRV 
CGICGFAHST AYTTSVENAM GIQVPERAQM IRAILLEVER LHSHLLNLGL ACHFTGFDSG 
FMQFFRVRET SMKMAEILTG ARKTYGLNLI GGIRRDLLKD DMIQTRQLAQ QMRREVQELV 
DVLLSTPNME QRTVGIGRLD PEIARDFSNV GPMVRASGHA RDTRADHPFV GYGLLPMEVH 
SEQGCDVISR LKVRINEVYT ALNMIDYGLD NLPGGPLMVE GFTYIPHRFA LGFAEAPRGD 
DIHWSMTGDN QKLYRWRCRA ATYANWPTLR YMLRGNTVSD APLIIGSLDP CYSCTDRMTV 
VDVRKKKSKV VPYKELERYS IERKNSPLK