Gene TM1040_1106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1106
Symbol
ID	4077813
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1188053
End bp	1189552
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	61%
IMG OID	638006410
Product	methylmalonate-semialdehyde dehydrogenase [acylating]
Protein accession	YP_613101
Protein GI	99080947
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01722] methylmalonic acid semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGAAC TGACCCATTA CGTGAATGGT GAAAAAGTCG CCGGGACCTC CGGCCGTTTT 
GCCGACGTTT TGAACCCCGC CACCGGTGAA GTGCAGGCCA AGGTGCCGCT TGCCACCAAG 
GCGGAAATGG ACGCAATCAT CGCCAAAGCC GCCGAAGCAC AGGTGGAATG GGCGGCAACC 
AACCCGCAAA AACGCGCCCG TGTGATGATG AAGTTCGGCC AACTCATCAA CGAACACATG 
GACACGCTCG CAGAACTGGT TGCCCGTGAA CACGGCAAGA CCCTGCCTGA TGCGCGCGGC 
GACGTGCAGC GCGGCCTTGA AGTTGTCGAG GTCTGCATGG GCACGCCGAG CCTGCTGAAA 
GGCGAATTCA CCGACAGCGG CGGACCGGGC ATCGACCTTT ACTCCATGCG CCAGCCTCTG 
GGTGTGGTTG CGGGCATCAC CCCCTTCAAC TTCCCGGCGA TGATCCCCTT GTGGAAAATG 
GCCCCTGCCC TCTCGTGCGG CAACGCCATG ATCCTGAAAC CTTCCGAGCG CGTGCCGTCC 
ACCTCGCTCT ATCTGGCGGA GCTTCTGAAA GAAGCCGGTC TGCCTGATGG TGTGCTGCAG 
GTTGTGAACG GCGACAAGGA AGCCGTGGAC GCGATCCTCG ACAACGAGAC CATTCAGGCC 
GTGGGCTTTG TGGGTTCCAC CCCGATTGCG CAGTATATCT ATGGCCGCGC GGCGACCAAC 
GGCAAGCGCG CGCAGTGCTT TGGCGGCGCC AAGAACCACA TGCTGATCAT GCCTGATGCG 
GATCTCGACA AGGCGGCAGA CGCGCTGGTT GGTGCCGGGT TTGGCGCAGC GGGCGAACGC 
TGCATGGCGA TCTCCGTTGC GGTGCCGGTC GGCAAAGAAA CCGCCGATGG CCTCATTGAG 
CGTCTGGTGC CCCGCATCGA GAAACTCAAG GTCGGCCCCT ACACCGCCGG TGAGGACATC 
GACTACGGCC CCGTGATCAC CCCGCAGGCC AAGGCGCGCA TCGAGGGTCT CATTGACAGC 
GGCGTCGAGC AGGGCGCAAC CCTTGTGACC GATGGCCGTG GCCTGACGCT GCAGGGGTAT 
GAGAACGGCT ATTTTGTTGG CCCGACCCTC TTTGACAATG TCACCGCCGA GATGGACATT 
TACAAAGAAG AGATCTTTGG CCCGGTTCTG TCGACAGTCC GCATGGACAA CTACGAGGAC 
GCACTGAACC TTGTCAAAGA CAACGCCTAT GGCAACGGCA CCGCGATCTA CACTGCCGAT 
GGTGACACCG CGCGTGACTT TGCCAACCGC GTGAACGTGG GCATGGTCGG TATCAACTTC 
CCGATCCCGG TCCCGCTCAG CTACCACACC TTTGGCGGCT GGAAGAAATC GGCCTTTGGC 
GATCTGAACC AATATGGCCC CGACGCCTTC CGCTTCTACA CCCGCACCAA GACTGTGACC 
CAGCGCTGGT TCTCGGGCAT CAAAGAAGGC GGCGAATTCA ACTTCAAAGC CATGGACTGA

Protein sequence

MQELTHYVNG EKVAGTSGRF ADVLNPATGE VQAKVPLATK AEMDAIIAKA AEAQVEWAAT 
NPQKRARVMM KFGQLINEHM DTLAELVARE HGKTLPDARG DVQRGLEVVE VCMGTPSLLK 
GEFTDSGGPG IDLYSMRQPL GVVAGITPFN FPAMIPLWKM APALSCGNAM ILKPSERVPS 
TSLYLAELLK EAGLPDGVLQ VVNGDKEAVD AILDNETIQA VGFVGSTPIA QYIYGRAATN 
GKRAQCFGGA KNHMLIMPDA DLDKAADALV GAGFGAAGER CMAISVAVPV GKETADGLIE 
RLVPRIEKLK VGPYTAGEDI DYGPVITPQA KARIEGLIDS GVEQGATLVT DGRGLTLQGY 
ENGYFVGPTL FDNVTAEMDI YKEEIFGPVL STVRMDNYED ALNLVKDNAY GNGTAIYTAD 
GDTARDFANR VNVGMVGINF PIPVPLSYHT FGGWKKSAFG DLNQYGPDAF RFYTRTKTVT 
QRWFSGIKEG GEFNFKAMD