Gene M446_3859 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_3859
Symbol
ID	6131998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	4305206
End bp	4306699
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	70%
IMG OID	641644024
Product	aldehyde dehydrogenase
Protein accession	YP_001770666
Protein GI	170742011
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGATC AAACCCTAGG CAGCTGGAGC GAGCGGGCAC GGGCCCTCTC TATCCGCAAC 
GACGCGTTCG TCGAGGGCCG CTTCGTACCT GCGGCATCGG GCCGGACGTT CGACTGCGTC 
TTCCCGGGCA CCGGACGGCG GGTGAGCCAG GTGGCGGCCT GCGAAGCGGA CGACGTCGAT 
CGCGCGGTCC GCTCGGCCCG GCGCGCCTTC GAGGCGGGAT CCTGGTCGCG GATGGCGCCG 
GCCGATCGCA AGCGCGTCAT GCTGCGCTTC GCGGACCTCC TCCTGGCGAA CCGCGACGAA 
CTCGCGCTGC TGGAGACCCT GAACGTCGGC AAGCCCATCA CGAGCGCGCT GTCCGGAGAC 
ATCCCGAGCG CGGCGAACTG CATCGCGTTC TACGGCGAGG CGATCGACAA GATCTACGGC 
GAGGTCGCCC CCGCGCCCGC CGACTTCACC ACCCTGGTGA CGCGCGAGCC CCTCGGGGTG 
GTCGCGGCCG TGGTGCCGTG GAACTACCCC CTGTCGATGA CGGCCTGGAA GCTCGGCCCC 
GCCCTGGCCG CCGGGAACTC GGTCGTCGTG AAGCCGGCCG AGCAGTCGCC GTTCACGGCG 
CTGCGGATCG CCGAACTCGC GATGGAGGCC GGACTCCCGC CGGGGGTGCT CAACGTCGTG 
CCGGGCCTGG GCGAGACGGC CGGCCGAGCG CTCGGCCTCC ACATGGACGT CGACTGCGTT 
ACCTTCACCG GATCGACGGA GGTCGGGAAG CTCTTCCTGC AATATGCGGG ACGATCGAAC 
GCGAAGCGGG TGAGCCTCGA ACTCGGCGGC AAGTCGCCCC AGATCGTCAT GGCGGATTGC 
GCGGATCTCG ACGCCGCCGC GCAGGCGGTC GCCGCCGGGA TCTTCACCAA TGCCGGGCAG 
GTCTGCAACG CGGGCTCGCG GCTGATCGTC CAGGAGAGCG TCCGCGAGGA ACTGCTCGAG 
AAGGTGGTGG CCCGCGCCCG CGCGCTCAAG CCCGGCGACC CGCTCGATCC CGAGACCCGG 
CTGGGGCCGC TGGTCAGCGA GCCCCAGATG GAGCGCGTGC TCGGCTACAT CCGGAAGGGC 
CAGGAGGCAG GCGCGGCGGT CGTCGCCGGC GGCGGGCGCA CCCTGCTCGA CACCGGCGGC 
TACTTCGTCG AGCCGACCGT GTTCGACCGC GTCGAGAACC GCATGGCGAT CGCCCAGGAG 
GAGATCTTCG GGCCGGTCCT CTCCACGATC TCCGTGTCCG GCTTCGACGA GGCGATCGCC 
GTCGCGAACG ACACGATCTA CGGCCTCGCC GCTTCGATCT GGACGACTGA CCTGACCAAG 
GCGCACCGGG CGGCCCGCGC GATCCGGTCC GGCGTCGTCT ACGTGAACTG CTTCGACAAA 
GGGTCGATGT CCGTGCCCTT CGGCGGCTTC AAACAGTCCG GCTTCGGACG CGACAAGTCC 
TTGCACGCCA TCGACAAGTA CATGGACCTG AAGGCGGTCT GGTTCGCGAC CTGA

Protein sequence

MTDQTLGSWS ERARALSIRN DAFVEGRFVP AASGRTFDCV FPGTGRRVSQ VAACEADDVD 
RAVRSARRAF EAGSWSRMAP ADRKRVMLRF ADLLLANRDE LALLETLNVG KPITSALSGD 
IPSAANCIAF YGEAIDKIYG EVAPAPADFT TLVTREPLGV VAAVVPWNYP LSMTAWKLGP 
ALAAGNSVVV KPAEQSPFTA LRIAELAMEA GLPPGVLNVV PGLGETAGRA LGLHMDVDCV 
TFTGSTEVGK LFLQYAGRSN AKRVSLELGG KSPQIVMADC ADLDAAAQAV AAGIFTNAGQ 
VCNAGSRLIV QESVREELLE KVVARARALK PGDPLDPETR LGPLVSEPQM ERVLGYIRKG 
QEAGAAVVAG GGRTLLDTGG YFVEPTVFDR VENRMAIAQE EIFGPVLSTI SVSGFDEAIA 
VANDTIYGLA ASIWTTDLTK AHRAARAIRS GVVYVNCFDK GSMSVPFGGF KQSGFGRDKS 
LHAIDKYMDL KAVWFAT