Gene Smed_4064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4064
Symbol
ID	5317893
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	525933
End bp	526790
Gene Length	858 bp
Protein Length	285 aa
Translation table	11
GC content	61%
IMG OID	640775871
Product	short-chain dehydrogenase/reductase SDR
Protein accession	YP_001312804
Protein GI	150376208
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAGAT TTCCGCAGCC TCCCTTCCCC CGCCAAAAGC AGGAAATGCC TGGCACCACC 
GACCAGATGC AGCCGCTTCC CGACCACGGT GAGAACTCTT ACCAGGGCTC CGGACGCTTG 
AGAGACAAGA GAGCCATCAT CACCGGCGGG GACAGCGGTA TCGGCAGAGC CGTGGCGCTC 
GCCTTCGCCC GGGAGGGAGC GGATGTCCTT ATCAGCTATC TGAGCGAGCA TGAAGACGCC 
ATGGCCACCA AGGCCCTGGT GGAGGAAGCG GGCCGCAAGG CAGTCCTCGC CGCGGGCGAC 
ATCCAATCTT CCGACCATTG CCGGCGGATC GTCGAAACGG CGGTCCGGGA ACTCGGCGGT 
GTCGATATTC TCGTCAACAA CGCGGCCCAC CAGGCCTCTT TCAAGAACAT CGAGGATATA 
AGCGACGAGG AATGGGAGCT GACATTCCGG GTGAACATGC ACGCGATGTT CTACCTGACC 
AAGGCAGCCG TGCCGCACAT GAAGAAGGGC AGCGTCATCA TCAATACAGC TTCCATCAAT 
GCCGACGTCC CGAACCCGAT CCTGCTTGCC TATGCCACGA CGAAAGGCGC GATCCACAAT 
TTCAGTGCCG GTCTCGCGCA GATGCTGGCC GAGCGCGGGA TAAGAGTGAA TGTCGTAGCG 
CCCGGTCCGA TCTGGACCCC GCTGATCCCC TCCACCATGC CCGAGGATAG CGTCGCCAAC 
TTCGGCAAGC AGGTGCCGAT GAAACGTCCG GGGCAGCCGG TAGAACTCGC CTCGGCCTAC 
GTAATGCTCG CGGATCCGAT GTCGAGTTAC GTATCCGGCG CGACCATCGC GGTGACCGGC 
GGAAAGCCTT TCCTGTGA

Protein sequence

MERFPQPPFP RQKQEMPGTT DQMQPLPDHG ENSYQGSGRL RDKRAIITGG DSGIGRAVAL 
AFAREGADVL ISYLSEHEDA MATKALVEEA GRKAVLAAGD IQSSDHCRRI VETAVRELGG 
VDILVNNAAH QASFKNIEDI SDEEWELTFR VNMHAMFYLT KAAVPHMKKG SVIINTASIN 
ADVPNPILLA YATTKGAIHN FSAGLAQMLA ERGIRVNVVA PGPIWTPLIP STMPEDSVAN 
FGKQVPMKRP GQPVELASAY VMLADPMSSY VSGATIAVTG GKPFL