Gene B21_00309 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_00309
Symbol	mhpF
ID	8114220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	342356
End bp	343306
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	55%
IMG OID	644846595
Product	hypothetical protein
Protein accession	YP_002998168
Protein GI	251783864
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4569] Acetaldehyde dehydrogenase (acetylating)
TIGRFAM ID	[TIGR03215] acetaldehyde dehydrogenase (acetylating)

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAGC GTAAAGTCGC CATTATCGGT TCTGGCAACA TTGGCACCGA TCTGATGATT 
AAAATTTTGC GTCACGGTCA GCATCTGGAG ATGGCGGTGA TGGTTGGCAT TGATCCTCAG 
TCCGACGGTC TGGCGCGCGC CAGACGTATG GGCGTCGCCA CCACCCATGA AGGGGTGATC 
GGACTGATGA ACATGCCTGA ATTTGCTGAT ATCGACATTG TATTTGATGC GACCAGCGCC 
GGTGCTCATG TGAAAAACGA TGCCGCTTTA CGCGAAGCGA AACCGGATAT TCGCTTAATT 
GACCTGACGC CTGCTGCCAT CGGCCCTTAC TGCGTGCCGG TGGTTAACCT CGAGGCGAAC 
GTCGATCAAC TGAACGTCAA CATGGTCACC TGCGGCGGCC AGGCCACCAT TCCAATGGTG 
GCGGCAGTTT CACGCGTGGC GCGTGTTCAT TACGCCGAAA TTATCGCTTC TATCGCCAGT 
AAATCTGCCG GACCTGGCAC GCGTGCCAAT ATCGATGAAT TTACGGAAAC CACTTCCCGA 
GCCATTGAAG TGGTGGGCGG CGCGGCAAAA GGGAAGGCGA TTATTGTGCT TAACCCAGCA 
GAGCCACCGT TGATGATGCG TGACACGGTG TATGTATTGA GCGACGAAGC TTCACAAGAT 
GATATCGAAG CCTCAATCAA TGAAATGGCT GAGGCGGTGC AGGCTTACGT ACCGGGTTAT 
CGCCTGAAAC AGCGCGTGCA GTTTGAAGTT ATCCCGCAGG ATAAACCGGT CAATTTACCG 
GGCGTGGGGC AATTCTCCGG ACTGAAAACA GCGGTCTGGC TGGAAGTCGA AGGCGCAGCG 
CATTATCTGC CTGCCTATGC GGGCAACCTC GACATTATGA CTTCCAGTGC GCTGGCGACA 
GCGGAAAAAA TGGCCCAGTC ACTGGCGCGC AAGGCAGGAG AAGCGGCATG A

Protein sequence

MSKRKVAIIG SGNIGTDLMI KILRHGQHLE MAVMVGIDPQ SDGLARARRM GVATTHEGVI 
GLMNMPEFAD IDIVFDATSA GAHVKNDAAL REAKPDIRLI DLTPAAIGPY CVPVVNLEAN 
VDQLNVNMVT CGGQATIPMV AAVSRVARVH YAEIIASIAS KSAGPGTRAN IDEFTETTSR 
AIEVVGGAAK GKAIIVLNPA EPPLMMRDTV YVLSDEASQD DIEASINEMA EAVQAYVPGY 
RLKQRVQFEV IPQDKPVNLP GVGQFSGLKT AVWLEVEGAA HYLPAYAGNL DIMTSSALAT 
AEKMAQSLAR KAGEAA