Gene EcolC_0697 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0697
Symbol
ID	6065323
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	749428
End bp	750414
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	55%
IMG OID	641600103
Product	hydrogenase 2 protein HybA
Protein accession	YP_001723699
Protein GI	170018745
COG category	[C] Energy production and conversion
COG ID	[COG0437] Fe-S-cluster-containing hydrogenase components 1
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACAGAC GTAATTTTAT TAAAGCAGCC TCCTGCGGGG CATTGCTGAC GGGCGCGCTG 
CCGTCTGTCA GTCATGCGGC TGCTGAAAAC CGCCCGCCAA TTCCGGGATC GCTGGGGATG 
TTGTACGACT CGACCTTGTG CGTAGGCTGC CAGGCTTGCG TCACCAAGTG TCAGGATATC 
AATTTCCCTG AACGTAACCC GCAAGGGGAA CAGACCTGGT CGAACAACGA CAAACTGTCG 
CCGTATACCA ATAACATCAT TCAGGTGTGG ACCAGCGGCA CAGGGGTCAA CAAAGACCAG 
GAGGAGAACG GCTACGCGTA CATTAAGAAA CAGTGTATGC ACTGCGTCGA TCCGAACTGT 
GTCTCTGTGT GCCCGGTCTC TGCACTGAAA AAAGATCCGA AAACCGGCAT TGTCCATTAC 
GACAAAGACG TGTGCACCGG TTGCCGTTAC TGCATGGTCG CCTGTCCGTA CAACGTGCCG 
AAGTACGACT ACAACAACCC GTTTGGTGCG CTGCATAAGT GCGAGCTGTG CAACCAGAAA 
GGTGTGGAAC GTCTCGATAA AGGCGGTCTG CCTGGCTGCG TAGAAGTGTG CCCGGCGGGC 
GCGGTGATTT TCGGTACGCG TGAAGAGCTG ATGGCGGAGG CGAAAAAACG TCTGGCGCTG 
AAGCCTGGCA GCGAATACCA CTATCCGCGT CAGACGCTGA AATCTGGCGA CACTTACCTG 
CATACGGTGC CGCAATATTA TCCGCATCTG TACGGCGAGA AAGAGGGCGG CGGTACTCAG 
GTTCTGGTAC TGACGGGTGT GCCTTATGAA AATCTCGACC TGCCGAAACT GGACGATCTT 
TCTACCGGTG CGCGTTCCGA AAATATTCAA CACACCCTGT ATAAAGGCAT GATGCTACCA 
CTGGCTGTGC TGGCGGGCTT AACCGTGCTG GTTCGTCGCA ACACCAAAAA CGACCATCAC 
GACGGAGGAG ACGATCATGA GTCATGA

Protein sequence

MNRRNFIKAA SCGALLTGAL PSVSHAAAEN RPPIPGSLGM LYDSTLCVGC QACVTKCQDI 
NFPERNPQGE QTWSNNDKLS PYTNNIIQVW TSGTGVNKDQ EENGYAYIKK QCMHCVDPNC 
VSVCPVSALK KDPKTGIVHY DKDVCTGCRY CMVACPYNVP KYDYNNPFGA LHKCELCNQK 
GVERLDKGGL PGCVEVCPAG AVIFGTREEL MAEAKKRLAL KPGSEYHYPR QTLKSGDTYL 
HTVPQYYPHL YGEKEGGGTQ VLVLTGVPYE NLDLPKLDDL STGARSENIQ HTLYKGMMLP 
LAVLAGLTVL VRRNTKNDHH DGGDDHES