Gene M446_3040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_3040
Symbol
ID	6134889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	3363318
End bp	3364445
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	75%
IMG OID	641643231
Product	2-alkenal reductase
Protein accession	YP_001769885
Protein GI	170741230
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0397571
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGGATC GTTTCGTGCG GATCGCCCTC GGCGCCGCGC TGGGGCTGCT CGCCCTGTTC 
GTGGCGCAGC CCTACCTGAC CGCCCTGCTG TTCTCGGTGG AGCAGCCGCG GGCCGTCACC 
CCGCGCGGCG ACCTCGCCCC CGCCGAGGCC GCCACCGTGG CGCTGTTCGA GCGCGCCGCC 
CCCTCGGTCG TCTACGTCTT CGCGCGCCGC GCCCCCAGCG TGCAGGACCT GATGCGCCAG 
GGCATGGACG GCACCGAGCA GGGCGGGCAG GGGAGCGAGC AGACCGGGAC CGGCTTCGTC 
TGGGACGCGG GCGGCCACGT GGTCACCAAC AACCACGTCA TCCAGGGCGG CTCGGAGATC 
TCGGTGCGGC TGTCGAGCGG CGAGATCGTG CCGGCGACCC TGGTCGGCGC GGCGCCCAAC 
TACGACCTCG CGGTGCTGCG CCTCGGGCGG GTGAGCGCCA TGCCGCCGCC CATCGCCATC 
GGCAGCTCCG CCGACCTCAA GGTCGGGCAG TTCGTCTACG CGATCGGCAA CCCGTTCGGG 
CTCGACCACA CCCTGACCTC GGGGGTGATC AGCGCCCTGC AGCGGCGCCT GCCGACCCAG 
GAGGGGCGGG AGCTCTCGGG CGTGATCCAG ACCGACGCGG CGATCAACCC GGGCAATTCC 
GGCGGGCCGC TCCTCGACTC GGCCGGGCGG GTGATCGGGG TCAACACGGC CATCTTCTCG 
CCCTCGGGCG CGAGCGCCGG CATCGGCTTC GCGGTGCCGA TCGACGTCGT CAACCGCGTG 
GTGCCGGACC TGATCCGCAC GGGCCGCGCG CCGAGCCCGG GGATCGGCAT CGTGGCGGCG 
CAGGAGGAGG CGGCCGCCCG GCTCGGCATC GACGGGGTCG CGGTGGTGCG CGTGCTGCGC 
GGATCGCCGG CCGCCGCCGC CGGCCTGCGC GGCGTCGACC CGGCCACGGG CGAACTGGGC 
GACATCATCG TCGGGGTCAA CAACCGCCCG GTCCACCGCC TGGCCGACCT CACGGCGGCG 
ATCCAGGAGG CGGGCGTCGG CCGGACCCTG GAACTGACCA TCCTGCGCGA CGGGCGGCCG 
CGCACGCTCC AGATCACCAC GGCCGATATG GGGCAGCGCG TCCCTTGA

Protein sequence

MPDRFVRIAL GAALGLLALF VAQPYLTALL FSVEQPRAVT PRGDLAPAEA ATVALFERAA 
PSVVYVFARR APSVQDLMRQ GMDGTEQGGQ GSEQTGTGFV WDAGGHVVTN NHVIQGGSEI 
SVRLSSGEIV PATLVGAAPN YDLAVLRLGR VSAMPPPIAI GSSADLKVGQ FVYAIGNPFG 
LDHTLTSGVI SALQRRLPTQ EGRELSGVIQ TDAAINPGNS GGPLLDSAGR VIGVNTAIFS 
PSGASAGIGF AVPIDVVNRV VPDLIRTGRA PSPGIGIVAA QEEAAARLGI DGVAVVRVLR 
GSPAAAAGLR GVDPATGELG DIIVGVNNRP VHRLADLTAA IQEAGVGRTL ELTILRDGRP 
RTLQITTADM GQRVP