Gene Smed_0434 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0434
Symbol
ID	5321268
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	470311
End bp	472035
Gene Length	1725 bp
Protein Length	574 aa
Translation table	11
GC content	62%
IMG OID	640789369
Product	dihydroxy-acid dehydratase
Protein accession	YP_001326126
Protein GI	150395659
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.325257
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.619807
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACA AGAAAAAAGA ACTGAGAAGC CGTCATTGGT ATGGTGGCAC GCACAAAGAC 
GGCTTCATTC ATCGTTCCTG GATGAAGAAC CAGGGCTTTC CCGATCATGT TTTCGACGGA 
CGGCCGATCA TCGGCATCTG CAACACCTGG TCGGAGCTCA CGCCCTGCAA CAGCCATCTG 
CGCATTCTTG CCGAAGGTGT GAAGCGTGGC GTTTGGGAAG CGGGAGGCTT TCCGGTGGAG 
TTTCCGGTGT CGTCGCTCGG GGAGACGCAG ATGCGCCCGA CCGCGATGCT CTTCCGCAAT 
CTGCTCGCAA TGGACGTCGA AGAGGCGATC CGCGCCTATG ACATCGACGG GGTCGTGCTG 
CTCGGCGGCT GCGACAAGAC CACCCCGGGC CAACTGATGG GCGCGGCCTC GGTCGATCTC 
CCGACGATCG TGGTGTCCTC CGGCCCTATG CTGAACGGCA AGTGGAAGGG AAAGGACATC 
GGCTCGGGCA CGGATGTCTG GAAATTCTCC GAAGCCGTGC GCGCCGGTGA AATGAGCCTG 
CAGGAATTCA TGGCCGCCGA AAGCGGCATG TCGCGTTCGC CGGGTGTCTG CATGACCATG 
GGCACCGCGA CCACTATGGC TTCAGTCGTG GAAGCCATGG GCTTATCGCT GCCGACAAAC 
GCCGCCCTGC CCGCAGTCGA CGCTCGCCGC ATGGCGCTCG CGCATATGAC CGGCAAGCGC 
ATCGTCGAAA TGGTGCATGA GGATCTGAGG CTGTCGAAGA TCCTGACGAA GGAGAACTTC 
GAGAACGGCA TTATCGCCAA TGCCGCCGTG GGCGGCTCGA CCAACGCGGT AGTACACATG 
CTGGCGATCG CCGGGCGTGC GGGTATCGAT CTCTGTCTTG AGGATTTCGA TAGGGTGGGC 
GGCCAGGTGC CTTGCATCGT CAACTGCATG CCATCGGGAA AGTATCTGAT CGAAGATCTC 
GCTTATGCGG GCGGCCTGCC CGCCGTGATG AGTCGTATCC AGCACCTGCT TCATGCCGAC 
GCGCCAACCG TTTTCGGCGT TCCGATCAGT AAATACTGGG AGGGTGCAGA GGTCTATAAC 
GACGACGTCA TCCGCCCGCT GGACAACCCG CTGCGCGCCG CGGCCGGCAT TCGCGTCCTG 
AAGGGCAATC TCGCGCCCAA CGGCGCGGTG ATCAAGCCGT CGGCAGCGAG CGAACACCTT 
CTGACCCACG AAGGACCCGC CTTTGTCTTC GAGACAATCG AAGACCTTAG GGCCAGGATC 
GACGATCCTG ACCTGCCGGT GACCGAAAAC ACGATCCTCG TTCTCAAGGG TTGCGGCCCG 
AAGGGATATC CAGGCATGGC CGAGGTCGGC AACATGCCGA TTCCGCGAAG GCTCGTCGAA 
AGGGGCGTGC GCGACATGGT ACGCATCTCG GATGCACGCA TGTCCGGCAC CGCTTTCGGC 
ACGGTGGTTC TCCATGTAAG CCCGGAAGCC GATGCGGGCG GCCCGCTGGC GATCGTCCGG 
ACCGGAGACC TGATCCGTCT CGACGCAATG AAGGGCGAAT TGAACCTGCT CATCGGCGAG 
GAAGAGCTGG CGGCCCGCAT GGCGGCCTGG CGGCCGCCGG AAAAGAAATG GCAGCGAGGC 
TATTACAAAC TCTATCACGA CACCGTGCTG CAGGCCGACA AGGGTGCCGA CCTCGATTTC 
CTCGTCGGCA AGAGCGGCAG CGAGGTGCTC CGTGAAAGTC ACTGA

Protein sequence

MSDKKKELRS RHWYGGTHKD GFIHRSWMKN QGFPDHVFDG RPIIGICNTW SELTPCNSHL 
RILAEGVKRG VWEAGGFPVE FPVSSLGETQ MRPTAMLFRN LLAMDVEEAI RAYDIDGVVL 
LGGCDKTTPG QLMGAASVDL PTIVVSSGPM LNGKWKGKDI GSGTDVWKFS EAVRAGEMSL 
QEFMAAESGM SRSPGVCMTM GTATTMASVV EAMGLSLPTN AALPAVDARR MALAHMTGKR 
IVEMVHEDLR LSKILTKENF ENGIIANAAV GGSTNAVVHM LAIAGRAGID LCLEDFDRVG 
GQVPCIVNCM PSGKYLIEDL AYAGGLPAVM SRIQHLLHAD APTVFGVPIS KYWEGAEVYN 
DDVIRPLDNP LRAAAGIRVL KGNLAPNGAV IKPSAASEHL LTHEGPAFVF ETIEDLRARI 
DDPDLPVTEN TILVLKGCGP KGYPGMAEVG NMPIPRRLVE RGVRDMVRIS DARMSGTAFG 
TVVLHVSPEA DAGGPLAIVR TGDLIRLDAM KGELNLLIGE EELAARMAAW RPPEKKWQRG 
YYKLYHDTVL QADKGADLDF LVGKSGSEVL RESH