Gene Smed_4477 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4477
Symbol
ID	5318342
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	959217
End bp	960713
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	63%
IMG OID	640776278
Product	aldehyde dehydrogenase
Protein accession	YP_001313210
Protein GI	150376614
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.749064
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGGCG CGTGCCGTAA CCCGGCCGTC GCGCTTGCGG AAGAAGACAA GGAAGCGGAA 
GCCATGACAC TTCACCAGAA CCTGATCGCC GGCGAATGGG TCGGCGAAGA CGGCGTTGCG 
AACGTCAACC CGTCGAACAC CAATGACGTC GTCGGAGATT ATGCCCGCGC CAGCGCCGAA 
GACGCGAAAG CCGCGATTGC GGCGGCCAAG GCTGCCTTTC CCACCTGGTC GCGCTCCGGC 
ATCCTCGAGC GCCATGCGAT CCTGAAGAAA ACCGCCGACG AAATCCTCGC CCGCAAGGAC 
GAGCTGGGAC GGCTGCTGTC GCGTGAGGAG GGCAAGACCC TCGCCGAGGG GATCGGCGAA 
ACGGTCCGGG CCGGTCAGAT CTTCGAATTC TTCGCCGGCG AAACTTTGCG CCTCGCTGGC 
GAGGTCGTCC CATCGGTCAG GCCGGGCATC GGCGTCGAGA TCACCCGCGA GCCGGTCGGC 
GTCGTTGGCA TCATCACGCC CTGGAACTTT CCCATCGCCA TTCCCGCCTG GAAGGTCGCT 
CCGGCGCTCT GCTACGGCAA TACCGTCGTC TTCAAGCCGG CGGAACTGGT ACCGGGCTGT 
TCATGGGCGA TCGTCGATAT CCTCCATCGT GCGGGCCTGC CAAAGGGCGT ACTGAACCTC 
GTCATGGGCA AGGGTTCGGT CGTAGGCCAG GCAATGCTCG ACAGCCCGGA CGTTCAGGCG 
ATAACCTTCA CTGGCTCGAC CGCAACCGGA AAACGGGTCG CAGTCGCCTC GGTCGAACAT 
AACCGCAAAT ACCAGTTGGA GATGGGAGGT AAGAACCCGT TCGTCGTTCT CGACGACGCC 
GATCTTTCCG TTGCCGTCGA AGCGGCAGTC AATTCCGCCT TTTTCTCGAC CGGTCAGCGT 
TGCACCGCCT CCTCGCGGAT CATCGTCACC GAGGGCATCC ATGACCGGTT CGTCGCCGCC 
ATGGGCGAGC GGATCAAGGG TCTCGTCGTC GACGACGCGC TGAAGGCCGG CACCCATATC 
GGACCGGTGG TCGATCAGAG CCAGCTCAAT CAGGACACCG ACTACATCGC CATCGGCAAG 
AAGGAGGGCG CGAAGCTCGC CTTCGGCGGT GAACTGGTCT CGCGTGACAC GCCCGGCTTC 
TATCTGCAGC CGGCGCTGTT CACCGAGGCG ACGAACGATA TGCGTATCTC CCGCGAGGAA 
ATCTTCGGAC CTGTCGCGGC CGTCATCCGC GTCAGGGATT ACGATGAAGC GCTGGCCGTC 
GCCAATGACA CGCCCTTCGG TCTGTCTTCG GGTATCGCCA CCACCAGCTT GAAACACGCG 
ACGCACTTCA AGCGCAATGC CGAGGCCGGC ATGGTGATGG TCAACCTGCC CACGGCGGGT 
GTCGACTTCC ACGTGCCGTT CGGCGGCCGC AAGGCTTCCT CCTACGGTCC TCGCGAGCAG 
GGCAAATACG CCGCTGAATT CTACACCAAT GTCAAAACCG CCTACACGCT GGCTTGA

Protein sequence

MAGACRNPAV ALAEEDKEAE AMTLHQNLIA GEWVGEDGVA NVNPSNTNDV VGDYARASAE 
DAKAAIAAAK AAFPTWSRSG ILERHAILKK TADEILARKD ELGRLLSREE GKTLAEGIGE 
TVRAGQIFEF FAGETLRLAG EVVPSVRPGI GVEITREPVG VVGIITPWNF PIAIPAWKVA 
PALCYGNTVV FKPAELVPGC SWAIVDILHR AGLPKGVLNL VMGKGSVVGQ AMLDSPDVQA 
ITFTGSTATG KRVAVASVEH NRKYQLEMGG KNPFVVLDDA DLSVAVEAAV NSAFFSTGQR 
CTASSRIIVT EGIHDRFVAA MGERIKGLVV DDALKAGTHI GPVVDQSQLN QDTDYIAIGK 
KEGAKLAFGG ELVSRDTPGF YLQPALFTEA TNDMRISREE IFGPVAAVIR VRDYDEALAV 
ANDTPFGLSS GIATTSLKHA THFKRNAEAG MVMVNLPTAG VDFHVPFGGR KASSYGPREQ 
GKYAAEFYTN VKTAYTLA