Gene Smed_5240 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5240
Symbol
ID	5319542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	202030
End bp	203544
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	65%
IMG OID	640777017
Product	aldehyde dehydrogenase
Protein accession	YP_001313949
Protein GI	150377354
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.979881
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTTGCGA ATTTCATCAC TCCCGATGCC AGAGATCCTC GGCTTGCCAT TAAAGCCCGC 
TATCGGATGC TTGTCGACGG CAAGTCCGTC GACGCAGTGT CCGGGCGGAC AATCGATCGC 
GTGAGTCCCG GCCATTTAGG CGTCGTGGTC GGAACCTGGC CGGAAGCGTC TCCAGAGGAT 
GTGCGGTTGG CGATTGCGGC TGCCCGCCGT GCCTTTGATA CCGGTCCGTG GCCGCGCATG 
TCGGGCGCAG AACGGTCGCG CCTGATGTTC AAGGTCGCCG ACCTCATCCT TGCGCGGCAG 
GAGGAACTGG CGCTGATCGA GAGCCTCGAG GTCGGCAAGC CGATCGCGCA GGCGCGCGGC 
GAAATCGGTT TCTGCGCAGA CCTCTGGTCC TATGCCGCCG GCCAGGCCCG CGCGCTGGAA 
GGACAGACCC ACAACAATAT CGGCGACGAC CGCCTGGGCC TCGTCCTGCG CGAGCCGGTC 
GGGGTGGTCG GCATTATTAC GCCCTGGAAT TTCCCTTTCA TCATCGCGTC GGAACGCGTG 
CCCTGGGCGA TCGGCGCCGG CTGCACCGTT GTGCTGAAGC CATCCGAGTT CACTTCTGGT 
ACGTCGATCC GCATGGCGGA ACTGGCACGT GAAGCCGGCA TTCCGGACGG GGTGTTCAAC 
GTCGTCACCG GTTATGGCGA TCCGGCCGGC CAGGTGCTGG CCGAAGACCC CGAGGTCGAC 
ATGGTCGCCT TTACCGGCTC TGTCCGCGTC GGCACGAAGC TCGGCGAGAT TGCGGCGCGC 
AGCGTCAAGC GCGTCGGGCT TGAGCTTGGC GGCAAAGGCC CGCAGATTGT CTTCGCCGAT 
GCAGACCTCG ACGCGGCCGC AGACGGCATC GCCTATGGCG TCTACCACAA TGCCGGCCAG 
TGCTGCATTT CCGGCAGCCG GCTCCTCGTG CAGGAGGGCA TCCGCGATGC GCTGATGGAG 
CGCCTGCTCG ACATCTCGCG CAAGGTGACC TTCGGCGATC CCCTGAACGA ACGCACCAAG 
ATCGGCGCGA TGATCTCGGA GGCGCATGCG GAAAAGGTGC ATTCTTATGT GACGGCTGGC 
ATCGCATCGG GCGCGGAGCT GCTTCTCGGT GGCGAAAGGG TCGGCAGGGA GGCCGGGCTT 
TACTACGCAC CGACGGTATT TTCCGGCGTC ACGCCCGACA TGTCGATCGC ACGCGAGGAG 
ATCTTCGGCC CGGTGCTTTC AACGCTGACC TTCAAGACCG CGGATCACGC CGTAGCCTTG 
GCGAATGCCA CCGAGTTCGG CCTTTCGGCC AGCGTCTGGT CGACCAATCT CGAAACCGCG 
CTGCAGAGCA TCCGCCGCAT TCGCGCCGGC CGCTGCTGGA TCAACAGCGT GATCGACGGC 
ACGCCGGAGC TGCCGATCGG CGGCTACAAG AAGAGCGGCC TGGGCCGCGA GCTCGGCCGC 
TACGGCTTTG ACGAATATTC CCAGTTCAAG GGCGTCCACG TGACACTCGG GCGCCCCGCG 
CCCTGGTTCA CATAA

Protein sequence

MLANFITPDA RDPRLAIKAR YRMLVDGKSV DAVSGRTIDR VSPGHLGVVV GTWPEASPED 
VRLAIAAARR AFDTGPWPRM SGAERSRLMF KVADLILARQ EELALIESLE VGKPIAQARG 
EIGFCADLWS YAAGQARALE GQTHNNIGDD RLGLVLREPV GVVGIITPWN FPFIIASERV 
PWAIGAGCTV VLKPSEFTSG TSIRMAELAR EAGIPDGVFN VVTGYGDPAG QVLAEDPEVD 
MVAFTGSVRV GTKLGEIAAR SVKRVGLELG GKGPQIVFAD ADLDAAADGI AYGVYHNAGQ 
CCISGSRLLV QEGIRDALME RLLDISRKVT FGDPLNERTK IGAMISEAHA EKVHSYVTAG 
IASGAELLLG GERVGREAGL YYAPTVFSGV TPDMSIAREE IFGPVLSTLT FKTADHAVAL 
ANATEFGLSA SVWSTNLETA LQSIRRIRAG RCWINSVIDG TPELPIGGYK KSGLGRELGR 
YGFDEYSQFK GVHVTLGRPA PWFT