Gene Smed_2446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2446
Symbol
ID	5323307
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2528233
End bp	2529669
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	64%
IMG OID	640791384
Product	aldehyde dehydrogenase
Protein accession	YP_001328113
Protein GI	150397646
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACGA ACACGCATTA TATTGACGGC CGGTTTGTCG AGGATCGCAT CTCAGGCCGC 
ATCGCGGTCT ACAATCCCGC AAGCGAGGAG CAGATCGCCG AGATCCCGGA TGGTCCTGCC 
GAGGTCGTCG ACGCGGCCGT CGATGCGGCA CGCAAGGCGC AACCCGCCTG GTCGGAGTTG 
CCGCCCATCG AACGCGCCGG CTATGTCAAG GCGATTGCCG AGAAGATTCG CGCGAAGGTC 
GACATTCTGG CCGAAACGAT CTCCCGCGAG CAGGGCAAGG TCGTGTCGCT TGCGCGCGGC 
GAAGTGCTCG GCATGGCCGG GCTTATGGAC TACATGGCCG AGTGGGCGCG CCGCATCGAG 
GGCGAGATCA TCGCCAGCGA CCGGAAAGGC GAGACGATCT ATCTGAACCG GGTGCCGATC 
GGCGTGGTTG CCGGCATACT GCCCTGGAAC TTTCCGTTCT ACCTGATCGG ACGCAAACTC 
GCCCCGGCGC TCGTCGCCGG CAACACGATC GTCATCAAAC CGAGCGAGGA AACGCCGCTC 
AATGCATTTC TCTTCGCCGA ACTGGCGGAC GAGGTCGGGC TGCCGAAGGG CGTGTTCAAC 
ATGGTTTCAG GACGTGGCCG CACGACGGGC GCCGCCCTGT CGGGCCATCC CGGCATCGAT 
CTCGTAAGCT TCACTGGCAG CGTGCCGACC GGTGTCGCCA TCATGGAGGC AGCGGCGAAG 
AACCTCACGC GGGTCAATCT CGAACTCGGC GGCAAGGCGC CCGCAATCGT CCTCAAGGAT 
GCCGACCTCG ACCTGGCGGT CGAAGCCATC ACGGCCTCGC GCGTCATCAA CACCGGCCAG 
GTCTGCAACT GCGCGGAACG CATTTTCGTC GAACGCCAGG TGGCCGACGA ATTCACCGAC 
CGCTTCGTCA AGCGGATGGC CGCCGTCACC TACGGAGACC CGATCGCCGA GCCGACCGTC 
GACATGGGGC CGCTCGTCAA TGCGCTCCAA TTGGACAAGG TCGAGGCCAT GGTCGAACGG 
GCAAGGGAGG CTGGGGCATC GGTGGCGCTG GGCGGAAAGC GCGCCGAGCG CAATTGCGGC 
CACCATTATG AACCGACCGT GCTCACGGGC TGCACGCCCG ACATGGAGAT CATGCGCAAG 
GAGATATTCG GACCCGTCGC GCCGATCGCC GTGGTCGAAG ACGCCGACGA GGCTGTTCAC 
TACGCCAACG ACACCGAATA CGGCCTGACG TCGTCGCTCT ACACGCAGGA CCTCAACAAG 
GCCATGCGCG TGACGCGGCG CCTGCAGTTC GGCGAGACCT ACATCAACCG CGAAAACGGC 
GAGGCGTATC AAGGCTTTCA TGCCGGTCGC AAGAAATCCG GCATCGGCGG TGCAGATGGC 
AAGCACGGCT TTTACGAATA CATGGAAACC CAGGCGGTCT ATATCCAGCA CGGTTGA

Protein sequence

MSTNTHYIDG RFVEDRISGR IAVYNPASEE QIAEIPDGPA EVVDAAVDAA RKAQPAWSEL 
PPIERAGYVK AIAEKIRAKV DILAETISRE QGKVVSLARG EVLGMAGLMD YMAEWARRIE 
GEIIASDRKG ETIYLNRVPI GVVAGILPWN FPFYLIGRKL APALVAGNTI VIKPSEETPL 
NAFLFAELAD EVGLPKGVFN MVSGRGRTTG AALSGHPGID LVSFTGSVPT GVAIMEAAAK 
NLTRVNLELG GKAPAIVLKD ADLDLAVEAI TASRVINTGQ VCNCAERIFV ERQVADEFTD 
RFVKRMAAVT YGDPIAEPTV DMGPLVNALQ LDKVEAMVER AREAGASVAL GGKRAERNCG 
HHYEPTVLTG CTPDMEIMRK EIFGPVAPIA VVEDADEAVH YANDTEYGLT SSLYTQDLNK 
AMRVTRRLQF GETYINRENG EAYQGFHAGR KKSGIGGADG KHGFYEYMET QAVYIQHG