Gene Smed_3159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3159
Symbol
ID	5324038
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	3318346
End bp	3319878
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	65%
IMG OID	640792107
Product	aldehyde dehydrogenase
Protein accession	YP_001328818
Protein GI	150398351
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.510599
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATTG CAGCCAAGAA GGTCGACGTT GCAAAGGAGG CTGCGGCTCT CCTTGAGAAG 
ATGGGCGTCG CCAAAGAACT CTACGCAGGC GGGGACATGC CGTCTTTCAG CCCTGTCACC 
GGCGAGAAGA TCGCCAGCCT CAAGACCGTG ACGGCCAGCG AGGCCGCCGG GAAGATCGAG 
CGGGCCGACG AGGCCTTCCG CTCCTGGAGG CTCGTACCGG CGCCCAAGCG CGGCGAACTC 
GTCCGCCTGC TTGGCGAGGA GCTGCGCGCC TTCAAGGCAG ATCTCGGACG CCTCGTCTCG 
ATCGAAGCCG GAAAGATCCC CTCCGAAGGC CTCGGCGAAG TGCAGGAAAT GATCGACATC 
TGCGATTTCG CCGTCGGCCT TTCCCGTCAG CTCTACGGTC TGACGATCGC GACCGAGCGT 
CCCGGCCACC GGATGATGGA AACCTGGCAT CCGCTCGGCG TCGTCGGCAT CATCTCGGCG 
TTCAACTTTC CCGTCGCGGT ATGGTCTTGG AATGCGGCGC TCGCGCTCGT TTGCGGCGAT 
GCCGTCGTCT GGAAGCCGTC GGAAAAGACA CCGCTTACCG CGCTTGCATG CCAGGCGATC 
CTGGAACGCG CCATTGCCCG TTTCGGCGAC GCCCCGGAAG GCCTGTCGCA GGTCCTGATC 
GGTGACCGTG CGATTGGCGA GGTACTCGTC GACCATCCGA AGGTGCCTCT CGTCTCGGCG 
ACCGGCTCGA CCCGCATGGG CCGCGAGGTC GGTCCGCGGC TTGCCAAGCG CTTCGCCCGT 
GCGATCCTGG AACTCGGCGG CAACAATGCG GGCATCGTCT GCCCCTCCGC CGATCTCGAC 
ATGGCGCTTC GCGCCATCGC CTTCGGCGCA ATGGGCACCG CCGGTCAACG CTGCACGACG 
CTGCGCCGCC TCTTCGTCCA TGAGAGCGTC TATGATCAGC TCGTGCCGCG GCTGAAGAAA 
GCCTATCAGT CGGTTTCCGT CGGCAATCCG CTGGAACCGG CCGCACTGGT CGGGCCGCTC 
GTCGACAAGG CAGCCTTTGA CGGCATGCAG AAGGCGATCT CGGAGGCGCA GAGCCATGGC 
GGATCCGTCA CCGGCGGCGA ACGCGTCGAA CTCGGCTACG ACAATGGCTT CTACGTCAAG 
CCCGCTCTGG TCGAAATGCC GCAGCAGGAG GGACCGGTTC TCGAAGAGAC CTTCGCGCCG 
ATCCTCTACG TCATGAAGTA CAGCGACTTC GACGCGGTGC TCGCCGAACA CAATGCAGTT 
GCCGCCGGAC TTTCGTCCTC GATCTTCACC CGGGACATGC AGGAAGCGGA GCGCTTCCTC 
GCAGCCGATG GCTCCGACTG CGGCATCGCC AACGTCAATA TCGGCACCTC CGGGGCCGAG 
ATCGGTGGGG CGTTCGGTGG CGAGAAGGAG ACCGGCGGCG GCCGCGAATC CGGTTCGGAC 
GCCTGGAAGG CCTATATGCG ACGCGCCACA AATACGGTGA ACTATTCCAA GGCTCTGCCG 
CTGGCGCAGG GCGTCTCTTT CGACATCGAA TAA

Protein sequence

MNIAAKKVDV AKEAAALLEK MGVAKELYAG GDMPSFSPVT GEKIASLKTV TASEAAGKIE 
RADEAFRSWR LVPAPKRGEL VRLLGEELRA FKADLGRLVS IEAGKIPSEG LGEVQEMIDI 
CDFAVGLSRQ LYGLTIATER PGHRMMETWH PLGVVGIISA FNFPVAVWSW NAALALVCGD 
AVVWKPSEKT PLTALACQAI LERAIARFGD APEGLSQVLI GDRAIGEVLV DHPKVPLVSA 
TGSTRMGREV GPRLAKRFAR AILELGGNNA GIVCPSADLD MALRAIAFGA MGTAGQRCTT 
LRRLFVHESV YDQLVPRLKK AYQSVSVGNP LEPAALVGPL VDKAAFDGMQ KAISEAQSHG 
GSVTGGERVE LGYDNGFYVK PALVEMPQQE GPVLEETFAP ILYVMKYSDF DAVLAEHNAV 
AAGLSSSIFT RDMQEAERFL AADGSDCGIA NVNIGTSGAE IGGAFGGEKE TGGGRESGSD 
AWKAYMRRAT NTVNYSKALP LAQGVSFDIE