Gene B21_00314 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_00314
Symbol	frmA
ID	8113144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	347698
End bp	348807
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	54%
IMG OID	644846600
Product	hypothetical protein
Protein accession	YP_002998173
Protein GI	251783869
COG category	[C] Energy production and conversion
COG ID	[COG1062] Zn-dependent alcohol dehydrogenases, class III
TIGRFAM ID	[TIGR02818] S-(hydroxymethyl)glutathione dehydrogenase/class III alcohol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATCAC GTGCTGCCGT TGCATTTGCT CCCGGTAAAC CGCTGGAAAT CGTTGAAATT 
GACGTTGCAC CACCGAAAAA AGGTGAAGTG CTGATTAAAG TCACCCATAC CGGCGTTTGC 
CATACCGACG CATTTACCCT CTCCGGGGAT GACCCGGAAG GTGTATTCCC GGTGGTTCTC 
GGTCACGAAG GGGCCGGCGT TGTGGTTGAA GTCGGTGAAG GCGTAACCAG CGTCAAACCT 
GGCGACCATG TGATCCCGCT TTACACCGCG GAGTGCGGCG AGTGTGAGTT CTGTCGTTCT 
GGCAAAACTA ACCTCTGTGT TGCGGTTCGC GAAACCCAGG GTAAAGGCTT GATGCCAGAC 
GGCACCACCC GTTTTTCTTA CAACGGGCAG CCGCTTTATC ACTACATGGG ATGCTCAACA 
TTCAGTGAAT ACACCGTGGT CGCGGAAGTG TCTCTGGCCA AAATTAATCC AGAAGCAAAC 
CATGAACACG TCTGCCTGCT GGGCTGTGGC GTGACCACCG GTATTGGCGC GGTGCACAAC 
ACAGCTAAAG TCCAGCCAGG TGATTCTGTT GCCGTGTTTG GTCTTGGCGC GATTGGTCTG 
GCAGTGGTTC AGGGCGCGCG TCAGGCGAAA GCGGGACGGA TTATCGCTAT CGATACCAAC 
CCGAAGAAAT TCGATCTGGC TCGTCGCTTC GGTGCTACCG ACTGCATTAA CCCGAATGAC 
TACGACAAAC CGATTAAAGA TGTCCTGCTG GATATCAACA AATGGGGTAT CGACCATACC 
TTTGAATGCA TCGGTAACGT CAACGTGATG CGTGCGGCGC TGGAAAGTGC GCACCGCGGC 
TGGGGTCAGT CGGTGATCAT CGGGGTAGCA GGTGCCGGTC AGGAAATCTC CACCCGACCA 
TTCCAGTTGG TCACCGGTCG CGTATGGAAA GGTTCCGCGT TTGGCGGCGT GAAAGGTCGT 
TCCCAGTTAC CGGGTATGGT TGAAGATGCG ATGAAAGGTG ATATCGATCT GGAACCGTTT 
GTCACGCATA CCATGAGCCT TGATGAAATT AATGACGCCT TCGACCTGAT GCATGAAGGC 
AAATCCATTC GAACCGTAAT TCGTTACTGA

Protein sequence

MKSRAAVAFA PGKPLEIVEI DVAPPKKGEV LIKVTHTGVC HTDAFTLSGD DPEGVFPVVL 
GHEGAGVVVE VGEGVTSVKP GDHVIPLYTA ECGECEFCRS GKTNLCVAVR ETQGKGLMPD 
GTTRFSYNGQ PLYHYMGCST FSEYTVVAEV SLAKINPEAN HEHVCLLGCG VTTGIGAVHN 
TAKVQPGDSV AVFGLGAIGL AVVQGARQAK AGRIIAIDTN PKKFDLARRF GATDCINPND 
YDKPIKDVLL DINKWGIDHT FECIGNVNVM RAALESAHRG WGQSVIIGVA GAGQEISTRP 
FQLVTGRVWK GSAFGGVKGR SQLPGMVEDA MKGDIDLEPF VTHTMSLDEI NDAFDLMHEG 
KSIRTVIRY