Gene Smed_3703 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3703
Symbol
ID	5318423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	143824
End bp	145320
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	64%
IMG OID	640775516
Product	aldehyde dehydrogenase
Protein accession	YP_001312449
Protein GI	150375853
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01780] succinate-semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCCA TTTTTGCGCG CACAGCCTTT CACGATGCGT TGAAAAAACT GAACGACCGC 
CAATTGCTGC GGGAGCTTGC CTATGTCGGC GGCCGCTGGG TTGCCGGACG GGAGGGTTCC 
AGCCTTGAGG TGAGCGATCC GGCCAGCGGC GCGTCACTCG CCTTCGTCGC CTCGCTCGAC 
GCTGCACAGA CGTCGGAAGC GATCGACGCG GCGGAAAAAG CGTTCAGCTC CTGGCGTAAC 
ATGCTGCCGC AAGCACGCGC TGCGATTCTG CGCAAATGGC ACGGCCTCAT GCTCGACGCC 
CGGGAGGATC TCGCTCTTTT GATGACCCTG GAGCAAGGCA AGCCGCTCGC CGAGTCGCGC 
GGCGAGATCG AGTATGCGGC TTCGTTCATC GAGTGGTATG CCGAAGAGGG CAAGCGCCTC 
AATGCCGAAA GCGTGACGAG CCATCTGGCC GATGCCGAAA TGATCGTGCG ACGCGAAGCA 
CTCGGAGTCG TTGGCATCGT CACGCCCTGG AACTTCCCTT CCGCGATGAT CACGCGCAAG 
GCGGCCGCGG CCCTTGCTGC AGGCTGCACC GTGGTGGCGC ACCCCTCGTC CGAGACGCCC 
CTCTCGGCGC TCGCTCTGGC CGAACTCGGA GAGCGGGCCG GGCTTCCGGC TGGCGTCTTC 
AATGTCGTCA CCGGCAAGGC GGCAACGATC GTCGGACGAA TGTGCGAGGA CGCACGGGTG 
CGCGCCATGA GCTTCACCGG CTCGACCGAA ATCGGCCGCC TGATCGCCTC GCAATGCGCG 
CCGACGATGA AGCGGCTGGT GATGGAGCTC GGCGGTCATG CCCCCCTTAT TGTCTTCGCC 
GATGCGAATG TCGAAAAGGC TGCCGATATT GCGATAGCCG CGAAATTCGC CACTTCCGGC 
CAGGATTGCC TTGCCGCCAA TCGGATCTAC GTCGAACGGC CCGTGCTCAA GGCATTCCAG 
GAAGCCTTTG CCGCGCGGAT TGCCCGTTTG GAAGTCGGGT CCGGGATGGA ACCGGGTACG 
GATATCGGAC CGCTCATGCA CGAACGTGCC GTCGCCAAGG TAGAGGAACA AGTTGCGGAC 
GCATTGAAAT CGGGCGCCAG GCTTTCCGCC GGCGGCAAGC GACACGCCGC CGGGCCGCTC 
TTCTTCCAGC CGACCCTTCT GACGGATGTG CCGGACGACG CGCTGATCAT GCGCGAGGAG 
ACCTTCGGCC CTGTTGCGGC CATCTCCGCC TTCGATAGCG AAGACGAAGT GGTCGCGCGG 
GCGAACGACA CGGAATACGG GCTTGTCGCC TATGTCGTAA CCGATAACGG CGCCCGCCAG 
ATGCGGCTCG CCCGCGCCCT CGAATACGGC ATGGTAGCGA TCAATCGGGT GAAGATCACC 
GGTGGGCCGA TCCCCTTCGG TGGCTGGAAG CAATCGGGCC TCGGCCGCGA AGGCTCCCGC 
CACGGCATGG AGGCTTTCAC CGAACTCAAA TATCTCTGCA TCGACACCGC CGCCTGA

Protein sequence

MTAIFARTAF HDALKKLNDR QLLRELAYVG GRWVAGREGS SLEVSDPASG ASLAFVASLD 
AAQTSEAIDA AEKAFSSWRN MLPQARAAIL RKWHGLMLDA REDLALLMTL EQGKPLAESR 
GEIEYAASFI EWYAEEGKRL NAESVTSHLA DAEMIVRREA LGVVGIVTPW NFPSAMITRK 
AAAALAAGCT VVAHPSSETP LSALALAELG ERAGLPAGVF NVVTGKAATI VGRMCEDARV 
RAMSFTGSTE IGRLIASQCA PTMKRLVMEL GGHAPLIVFA DANVEKAADI AIAAKFATSG 
QDCLAANRIY VERPVLKAFQ EAFAARIARL EVGSGMEPGT DIGPLMHERA VAKVEEQVAD 
ALKSGARLSA GGKRHAAGPL FFQPTLLTDV PDDALIMREE TFGPVAAISA FDSEDEVVAR 
ANDTEYGLVA YVVTDNGARQ MRLARALEYG MVAINRVKIT GGPIPFGGWK QSGLGREGSR 
HGMEAFTELK YLCIDTAA