Gene B21_02545 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02545
Symbol	hypE
ID	8113240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	2692472
End bp	2693440
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	57%
IMG OID	644848744
Product	hypothetical protein
Protein accession	YP_003000317
Protein GI	251786013
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCAAT TAATCAACAG CCTGTTTATG GAAGCCTTTG CCAACCCGTG GCTGGCAGAG 
CAGGAAGATC AGGCACGTCT TGATCTGGCG CAGCTGGTAG CGGAAGGCGA CCGTCTGGCG 
TTCTCCACCG ACAGTTACGT TATTGACCCG CTGTTCTTCC CTGGCGGTAA TATCGGCAAG 
CTGGCGATTT GCGGCACAGC CAATGACGTT GCGGTCAGTG GCGCTATTCC GCGCTATCTC 
TCCTGTGGCT TTATCCTCGA AGAAGGATTG CCGATGGAGA CACTGAAAGC CGTAGTGACC 
AGCATGGCAG AAACCGCCCG CGCGGCAGGC ATTGCCATCG TTACTGGCGA TACTAAAGTG 
GTGCAGCGCG GCGCGGTAGA TAAACTGTTT ATCAACACCG CTGGCATGGG CGCAATTCCG 
GCGAATATTC ACTGGGGCGC ACAGACGCTA ACCGCAGGCG ATGTATTGCT GGTGAGCGGT 
ACACTCGGCG ACCACGGGGC GACTATCCTT AACCTGCGTG AGCAGCTGGG GCTGGATGGC 
GAACTGGTCA GCGACTGCGC GGTGCTGACG CCGCTTATTC AGACGCTGCG TGACATTCCC 
GGCGTGAAAG CGCTGCGTGA TGCCACCCGT GGTGGTGTAA ACGCGGTGGT TCATGAGTTC 
GCGGCAGCCT GCGGTTGTGG TATTGAACTT TCAGAAGCGG CACTGCCTGT TAAACCTGCC 
GTGCGTGGCG TTTGCGAATT GCTGGGACTG GACGCCCTGA ACTTTGCCAA CGAAGGCAAA 
CTAGTAATAG CTGTTGAACG CAACGCGGCA GAGCAAGTGC TGGCAGCGTT ACATTCCCAT 
CCACTGGGGA AAGACGCGGC GCTGATTGGT GAAGTGGTGG AACGTAAAGG TGTTCGTCTT 
GCCGGTCTGT ATGGCGTGAA ACGAACCCTC GATTTACCAC ACGCCGAACC GCTTCCGCGT 
ATATGCTAA

Protein sequence

MQQLINSLFM EAFANPWLAE QEDQARLDLA QLVAEGDRLA FSTDSYVIDP LFFPGGNIGK 
LAICGTANDV AVSGAIPRYL SCGFILEEGL PMETLKAVVT SMAETARAAG IAIVTGDTKV 
VQRGAVDKLF INTAGMGAIP ANIHWGAQTL TAGDVLLVSG TLGDHGATIL NLREQLGLDG 
ELVSDCAVLT PLIQTLRDIP GVKALRDATR GGVNAVVHEF AAACGCGIEL SEAALPVKPA 
VRGVCELLGL DALNFANEGK LVIAVERNAA EQVLAALHSH PLGKDAALIG EVVERKGVRL 
AGLYGVKRTL DLPHAEPLPR IC