Gene ECD_02379 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_02379
Symbol	hyfG
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	2472974
End bp	2474641
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	54%
IMG OID
Product	hydrogenase 4, subunit
Protein accession	ACT44199
Protein GI	253978529
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACGTTA ATTCATCGTC AAATCGTGGC GAAGCGATTC TCGCCGCCCT GAAAACGCAG 
TTCCCCGGCG CGGTGCTGGA TGAAGAGCGA CAAACGCCTG AACAGGTCAC CATTACGGTG 
AAAATCAATC TGCTGCCTGA CGTTGTACAG TATCTTTATT ATCAACATGA TGGCTGGCTT 
CCGGTCCTGT TTGGCAACGA CGAGCGGACA CTTAACGGTC ATTACGCGGT TTATTATGCC 
CTTTCAATGG AAGGGGCCGA AAAATGCTGG ATTGTGGTGA AGGCGCTGGT CGATGCCGAC 
AGTCGGGAGT TTCCGTCAGT CACACCGCGC GTCCCTGCCG CGGTCTGGGG CGAGCGAGAA 
ATTCGCGATA TGTACGGGCT GATTCCGGTT GGCCTGCCGG ATCAGCGTCG CCTGGTGTTG 
CCCGATGACT GGCCGGAAGA TATGCATCCG CTGCGCAAAG ATGCGATGGA TTATCGACTG 
CGCCCTGAAC CGACGACTGA TTCCGAAACG TATCCGTTTA TCAATGAGGG CAACAGCGAT 
GCGCGGGTGA TCCCTGTCGG CCCGCTGCAT ATCACCTCCG ATGAACCGGG TCACTTCCGC 
TTGTTTGTGG ATGGCGAGCA AATTGTCGAT GCTGATTACC GCCTGTTTTA TGTCCATCGC 
GGCATGGAGA AACTGGCAGA AACGCGGATG GGCTACAACG AAGTGACCTT CTTATCGGAC 
CGCGTGTGTG GGATTTGCGG TTTTGCCCAC AGTGTGGCCT ATACCAATTC GGTTGAAAAT 
GCACTGGGGA TTGAGGTGCC GCAACGAGCA CATACTATTC GCTCGATTCT GCTGGAAGTC 
GAACGGCTAC ACAGTCATTT GCTTAACCTT GGCCTCTCCT GCCATTTCGT TGGTTTTGAT 
ACCGGCTTTA TGCAATTTTT CCGCGTGCGG GAAAAGTCGA TGACGATGGC GGAATTGCTG 
ATCGGGTCGC GTAAAACCTA CGGTCTGAAT CTGATTGGTG GTGTTCGCCG CGATATTCTC 
AAAGAGCAAC GTCTGCAAAC GCTGAAACTG GTGCGCGAGA TGCGCGCCGA CGTGTCGGAG 
CTGGTAGAGA TGCTGCTTGC TACGCCGAAT ATGGAACAAC GCACTCAGGG CATTGGCATT 
CTCGACCGAC AAATCGCCCG TGATTTGCGC TTTGATCACC CCTACGCCGA CTACGGCAAT 
ATTCCAAAAA CACTGTTTAC CTTTACCGGC GGCGATGTTT TCTCCCGCGT GATGGTCCGT 
GTCAAAGAGA CGTTTGATTC GCTGGCAATG CTGGAATTTG CCCTCGACAA CATGCCGGAT 
ACCCCACTGC TGACCGAAGG CTTTAGCTAT AAACCTCACG CATTCGCGCT GGGCTTTGTT 
GAAGCGCCAC GCGGTGAAGA CGTGCACTGG AGCATGCTCG GTGATAACCA AAAATTGTTC 
CGCTGGCGCT GCCGTGCCGC CACCTACGCC AACTGGCCGG TGTTGCGTTA CATGCTGCGC 
GGCAATACCG TTTCTGACGC ACCGCTGATT ATCGGTAGCC TTGATCCCTG CTACTCCTGT 
ACCGACCGTG TGACGCTGGT AGATGTGCGC AAGCGCCAGT CAAAAACCGT GCCGTATAAA 
GAGATCGAAC GCTACGGCAT TGATCGTAAC CGTTCGCCGC TGAAGTAA

Protein sequence

MNVNSSSNRG EAILAALKTQ FPGAVLDEER QTPEQVTITV KINLLPDVVQ YLYYQHDGWL 
PVLFGNDERT LNGHYAVYYA LSMEGAEKCW IVVKALVDAD SREFPSVTPR VPAAVWGERE 
IRDMYGLIPV GLPDQRRLVL PDDWPEDMHP LRKDAMDYRL RPEPTTDSET YPFINEGNSD 
ARVIPVGPLH ITSDEPGHFR LFVDGEQIVD ADYRLFYVHR GMEKLAETRM GYNEVTFLSD 
RVCGICGFAH SVAYTNSVEN ALGIEVPQRA HTIRSILLEV ERLHSHLLNL GLSCHFVGFD 
TGFMQFFRVR EKSMTMAELL IGSRKTYGLN LIGGVRRDIL KEQRLQTLKL VREMRADVSE 
LVEMLLATPN MEQRTQGIGI LDRQIARDLR FDHPYADYGN IPKTLFTFTG GDVFSRVMVR 
VKETFDSLAM LEFALDNMPD TPLLTEGFSY KPHAFALGFV EAPRGEDVHW SMLGDNQKLF 
RWRCRAATYA NWPVLRYMLR GNTVSDAPLI IGSLDPCYSC TDRVTLVDVR KRQSKTVPYK 
EIERYGIDRN RSPLK