Gene EcHS_A2621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2621
Symbol
ID	5591064
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	2630430
End bp	2632097
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	54%
IMG OID	640921738
Product	hydrogenase-4, G subunit
Protein accession	YP_001459265
Protein GI	157161947
COG category	[C] Energy production and conversion
COG ID	[COG3261] Ni,Fe-hydrogenase III large subunit [COG3262] Ni,Fe-hydrogenase III component G
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	59
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACGTTA ATTCATCGTC AAATCGTGGC GAAGCGATTC TCGCCGCCCT GAAAACGCAG 
TTCCCCGGCG CGGTGCTGGA TGAAGAGCGA CAAACGCCTG AACAGGTCAC CATTACGGTG 
AAAATCAATC TGCTGCCTGA CGTTGTACAG TATCTTTATT ATCAACATGA TGGCTGGCTT 
CCGGTCCTGT TTGGCAACGA CGAGCGGACA CTTAACGGTC ATTACGCGGT TTATTATGCC 
CTTTCAATGG AAGGGGCCGA AAAATGCTGG ATTGTGGTGA AGGCGCTGGT CGATGCCGAC 
AGTCGGGAGT TTCCGTCAGT CACACCGCGC GTCCCTGCCG CGGTCTGGGG CGAGCGAGAA 
ATTCGCGATA TGTACGGGCT GATTCCGGTT GGCCTGCCGG ATCAGCGTCG CCTGGTGTTG 
CCCGATGACT GGCCGGAAGA TATGCATCCG CTGCGCAAAG ATGCGATGGA TTATCGACTG 
CGCCCTGAAC CGACGACTGA TTCCGAAACG TATCCGTTTA TCAATGAGGG CAACAGCGAT 
GCGCGGGTGA TCCCTGTCGG CCCGCTGCAT ATCACCTCCG ATGAACCGGG TCACTTCCGC 
TTGTTTGTGG ATGGCGAGCA AATTGTCGAT GCTGATTACC GCCTGTTTTA TGTCCATCGC 
GGCATGGAGA AACTGGCAGA AACGCGGATG GGCTACAACG AAGTGACCTT CTTATCGGAC 
CGCGTGTGTG GGATTTGCGG TTTTGCCCAC AGTGTGGCCT ATACCAATTC GGTTGAAAAT 
GCACTGGGGA TTGAGGTGCC GCAACGAGCA CATACTATTC GCTCGATTCT GCTGGAAGTC 
GAACGGCTAC ACAGTCATTT GCTTAACCTT GGCCTCTCCT GCCATTTCGT TGGTTTTGAT 
ACCGGCTTTA TGCAATTTTT CCGCGTGCGG GAAAAGTCGA TGACGATGGC GGAATTGCTG 
ATCGGGTCGC GTAAAACCTA CGGTCTGAAT CTGATTGGTG GTGTTCGCCG CGATATTCTC 
AAAGAGCAAC GTCTGCAAAC GCTGAAACTG GTGCGCGAGA TGCGCGCCGA CGTGTCGGAG 
CTGGTAGAGA TGCTGCTTGC TACGCCGAAT ATGGAACAAC GCACTCAGGG CATTGGCATT 
CTCGACCGAC AAATCGCCCG TGATTTGCGC TTTGATCACC CCTACGCCGA CTACGGCAAT 
ATTCCAAAAA CACTGTTTAC CTTTACCGGC GGCGATGTTT TCTCCCGCGT GATGGTCCGT 
GTCAAAGAGA CGTTTGATTC GCTGGCAATG CTGGAATTTG CCCTCGACAA CATGCAGGAT 
ACCCCACTGC TGACCGAAGG CTTTAGCTAT AAACCTCACG CATTCGCGCT GGGCTTTGTT 
GAAGCGCCAC GCGGTGAAGA CGTGCACTGG AGCATGCTCG GTGATAACCA AAAATTGTTC 
CGCTGGCGCT GCCGTGCCGC CACCTACGCC AACTGGCCGG TATTGCGTTA CATGCTGCGC 
GGCAATACCG TTTCTGACGC ACCGCTGATT ATCGGTAGCC TTGATCCCTG CTACTCCTGT 
ACCGACCGTG TGACGCTGGT AGATGTGCGC AAGCGCCAGT CAAAAACCGT GCCGTATAAA 
GAGATCGAAC GCTACGGCAT TGATCGTAAC CGTTCGCCGC TGAAGTAA

Protein sequence

MNVNSSSNRG EAILAALKTQ FPGAVLDEER QTPEQVTITV KINLLPDVVQ YLYYQHDGWL 
PVLFGNDERT LNGHYAVYYA LSMEGAEKCW IVVKALVDAD SREFPSVTPR VPAAVWGERE 
IRDMYGLIPV GLPDQRRLVL PDDWPEDMHP LRKDAMDYRL RPEPTTDSET YPFINEGNSD 
ARVIPVGPLH ITSDEPGHFR LFVDGEQIVD ADYRLFYVHR GMEKLAETRM GYNEVTFLSD 
RVCGICGFAH SVAYTNSVEN ALGIEVPQRA HTIRSILLEV ERLHSHLLNL GLSCHFVGFD 
TGFMQFFRVR EKSMTMAELL IGSRKTYGLN LIGGVRRDIL KEQRLQTLKL VREMRADVSE 
LVEMLLATPN MEQRTQGIGI LDRQIARDLR FDHPYADYGN IPKTLFTFTG GDVFSRVMVR 
VKETFDSLAM LEFALDNMQD TPLLTEGFSY KPHAFALGFV EAPRGEDVHW SMLGDNQKLF 
RWRCRAATYA NWPVLRYMLR GNTVSDAPLI IGSLDPCYSC TDRVTLVDVR KRQSKTVPYK 
EIERYGIDRN RSPLK