Gene Anae109_1665 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_1665
Symbol
ID	5375429
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	+
Start bp	1871474
End bp	1872952
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	76%
IMG OID	640843174
Product	methylmalonate-semialdehyde dehydrogenase
Protein accession	YP_001378853
Protein GI	153004528
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01722] methylmalonic acid semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.499432
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAGCA ACGTCTCCCC AGCGCGGGGC CAGCCCCCGG CGCCGCTCCC GCTGCTCGTG 
GACGGCGCGG CCCGTCCCGC CGAGGCCGCC GAGGCGGCGC CCGTCCTCGA GCCGGCCACC 
GGCAGGACGC TCGCGCAGGT CCCGCTCTGC GGCCCGGCCG ACGTCGACAC GGCGGTCCGG 
GCCGCCGCGG CGGCGTTCCC GGCCTGGCGC GCCACGCCCG TGCCGGAGCG CGTCCAGGTG 
CTGTTCCGCT ACAAGGCGCT CCTCGAGCGG GAGCAGGACG CGCTCGCGGC GTCGGTGTCG 
CGCGAGAACG GCAAGCTCCT CGCCGACGCG CGCAACGAGG TCCGCCGCGG GATCGAGGTG 
GTCGACTTCG CCTGCGGCAT GCCGACGCTC GCGCAGGGCC GGACGGTGGA GGGGATCGCC 
CGCGGCGTCG ACTCGCACAC CTGGCGAGTC CCGGTCGGCG TGGTCGCGGG GATCTGCCCG 
TTCAACTTCC CGGCGATGAT CCCGCTGTGG ATGTTCCCCA TCGCCATCGC GGCGGGGAAC 
ACCTTCGTCC TGAAGCCGTC CGAGCGGACG CCCATGACCG GGCTGCGGCT CGCCGAGCTG 
CTGCACGAGG CGGGGCTGCC CCCCGGCGTC CTCGACGTCG TGCACGGGGG TCGCGACGCG 
GTGGACGCCC TGCTCGATCA CCCGCTCGTG CGGGCCGTCT CCTTCGTCGG CTCGGAGGGG 
GTGGCCCGCC ACGTCTACGC CCGCGCCGCC GCGAACGGCA AGCGCGTGCA GGCGATGGCG 
GGCGCGAAGA ACCACCTGCT CGTGCTGCCC GACGCCGATC TGGAGCTCAC CGTCGCGGCG 
GTGATGGGCT CCGCGTTCGG CGCGGCCGGC CAGCGCTGCC TCGCGGGCAG CGTGCTCGTC 
GCGGTCGACG GCGCCGCGGA GCCGCTGCTC GAGCGGCTCA CCCGCGAGGC ACGCGCGGCG 
CGCGTCGGAG ATCCGTTCGC GGCCGACTCC GCCATGGGTC CGGTCATCCG CGAGGACGCG 
CGCGACCGCG TGCGGCGCTT CATCGAGACC GGGCTCGCCG AGGGCGCCGC GCTCCTCGTC 
GACGGGCGCG AGGCGGCGGC CGTCGGCGAC GGGTACTTCA TCGGGCCGAC CCTCTTCGAC 
GGCGTGCGGC CGGAGTCGGC GCTCGCCCGC GAGGAGATCT TCGGCCCGCT CCTCGCCACG 
GTGCGGGCGG GGAGCGTCGA GGAGGCGGTC GCGCTCGCCA ACCGCGCGCG CTACGGCAAC 
GCCGCCAGCA TCTTCACCTC GAGCGGCCGC GCCGCCGCCT ACTTCCGCCG CAACGTCGAG 
GCCGGGATGA TCGGCGTGAA CGTGGGGGTC GCCGCGCCCA TGGCGTTCTT CCCGTTCGCC 
GGCTGGAAGA GCTCGTTCTT CGGCGACCTG CACGCCACCG GCGAGGACGC GGTCCGCTTC 
TACACGGAGA CCCGGGTGGT CATCGAGCGA TGGGCCTGA

Protein sequence

MASNVSPARG QPPAPLPLLV DGAARPAEAA EAAPVLEPAT GRTLAQVPLC GPADVDTAVR 
AAAAAFPAWR ATPVPERVQV LFRYKALLER EQDALAASVS RENGKLLADA RNEVRRGIEV 
VDFACGMPTL AQGRTVEGIA RGVDSHTWRV PVGVVAGICP FNFPAMIPLW MFPIAIAAGN 
TFVLKPSERT PMTGLRLAEL LHEAGLPPGV LDVVHGGRDA VDALLDHPLV RAVSFVGSEG 
VARHVYARAA ANGKRVQAMA GAKNHLLVLP DADLELTVAA VMGSAFGAAG QRCLAGSVLV 
AVDGAAEPLL ERLTREARAA RVGDPFAADS AMGPVIREDA RDRVRRFIET GLAEGAALLV 
DGREAAAVGD GYFIGPTLFD GVRPESALAR EEIFGPLLAT VRAGSVEEAV ALANRARYGN 
AASIFTSSGR AAAYFRRNVE AGMIGVNVGV AAPMAFFPFA GWKSSFFGDL HATGEDAVRF 
YTETRVVIER WA