Gene Smed_0324 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0324
Symbol
ID	5321157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	352885
End bp	354381
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	63%
IMG OID	640789259
Product	methylmalonate-semialdehyde dehydrogenase
Protein accession	YP_001326017
Protein GI	150395550
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01722] methylmalonic acid semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.948085
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.128274
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATGAAC TCGGTCATTT CATCGATGGA AAGCGCGTCG CCGGCAAGAG CGGGCGCGTA 
AGCAAGATCT TCAACCCGGC GACTGGCGAG GTGCAAGGCA CCGTGGCGCT GGCGAGCGAC 
GCGGATCTTG CTGCCGCCGT CGAGAGCGCC AAGGCCGCCC AGCCCAAATG GGCCGCCACC 
AATCCGCAGC GCCGCGCCCG CGTTTTCATG AAGTTCGTCC AGCTCCTGAA CGACAACATG 
GACGAGCTCG CCGAGATGCT TTCCCGCGAG CATGGCAAGA CCATCGACGA TGCCAAGGGC 
GACATCGTGC GCGGCCTTGA AGTCTGCGAA TTCGTCATCG GCATTCCGCA TCTGCAGAAG 
AGCGAATTCA CGGAAGGTGC CGGTCCCGGC ATCGACATGT ATTCGATGCG CCAGCCCGTC 
GGCGTCGGCG CGGGCATCAC GCCGTTCAAC TTCCCCGGCA TGATCCCGAT GTGGATGTTC 
GCTCCGGCAA TCGCCTGCGG CAACGCCTTC ATCCTGAAGC CTTCCGAGCG TGATCCCTCC 
GTGCCGATCC GGCTTGCCGA ACTGATGATC GAAGCGGGCC TGCCTGCCGG CATTCTCAAC 
GTCGTCAACG GCGACAAGGG CGCGGTCGAT GCGATCCTGA CGCATCCTGA CATCGCCGCA 
GTTTCCTTCG TCGGCTCGAC CCCCATCGCC CGCTACGTCT ACGGTACGGC TGCGATGAAC 
GGCAAGCGTG CGCAATGCTT CGGCGGCGCG AAGAACCACA TGATCATCAT GCCGGATGCC 
GACCTCGACC AGGCCGCCAA TGCGCTGATC GGCGCCGGCT ACGGTTCCGC CGGCGAGCGC 
TGCATGGCGA TCTCGGTGGC CGTTCCGGTC GGCGAGGAAA CCGCAAACCG GCTGATCGAC 
AAGCTTGTGC CTATGGTCGA AAGCCTGCGC ATCGGCCCCT ATACCGACGA TAAGGCCGAT 
ATGGGGCCCG TCGTCACCAA GGAGGCGGAG CAGCGGATCC GCGGCCTGAT CGAGAGCGGC 
ATCGAGCAGG GTGCGAAGCT CGTCGTCGAC GGTCGCGATT TCAAGCTGCA GGGCTATGAG 
AACGGCCACT TCGTCGGCGG CTGCCTCTTC GATCACGTCA CGCCCGATAT GGACATCTAC 
AAGACGGAAA TCTTCGGACC CGTCCTGTCT GTCGTGCGCG CAACGAATTA CGAAGAGGCC 
CTGTCTCTGC CGATGAAACA CGAATACGGC AACGGCGTTG CCATCTATAC CCGCGACGGT 
GACGCTGCCC GCGACTTCGC CTCGCGCATC AACATCGGCA TGGTGGGCGT CAATGTTCCG 
ATCCCGGTTC CGCTCGCCTA CCATTCCTTC GGCGGCTGGA AATCTTCGTC CTTCGGCGAC 
CTCAACCAGC ATGGCCCGGA CTCGATCAAG TTCTGGACCC GCACCAAGAC CATCACCTCC 
CGTTGGCCGT CGGGCATCAA GGACGGTGCC GAGTTCTCGA TCCCGACGAT GCGGTAA

Protein sequence

MYELGHFIDG KRVAGKSGRV SKIFNPATGE VQGTVALASD ADLAAAVESA KAAQPKWAAT 
NPQRRARVFM KFVQLLNDNM DELAEMLSRE HGKTIDDAKG DIVRGLEVCE FVIGIPHLQK 
SEFTEGAGPG IDMYSMRQPV GVGAGITPFN FPGMIPMWMF APAIACGNAF ILKPSERDPS 
VPIRLAELMI EAGLPAGILN VVNGDKGAVD AILTHPDIAA VSFVGSTPIA RYVYGTAAMN 
GKRAQCFGGA KNHMIIMPDA DLDQAANALI GAGYGSAGER CMAISVAVPV GEETANRLID 
KLVPMVESLR IGPYTDDKAD MGPVVTKEAE QRIRGLIESG IEQGAKLVVD GRDFKLQGYE 
NGHFVGGCLF DHVTPDMDIY KTEIFGPVLS VVRATNYEEA LSLPMKHEYG NGVAIYTRDG 
DAARDFASRI NIGMVGVNVP IPVPLAYHSF GGWKSSSFGD LNQHGPDSIK FWTRTKTITS 
RWPSGIKDGA EFSIPTMR