Gene Smed_3922 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3922
Symbol
ID	5318707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	373568
End bp	375655
Gene Length	2088 bp
Protein Length	695 aa
Translation table	11
GC content	65%
IMG OID	640775732
Product	transketolase
Protein accession	YP_001312665
Protein GI	150376069
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0021] Transketolase
TIGRFAM ID	[TIGR00232] transketolase, bacterial and yeast

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGTTT CGCAGCAGAT CGAACCCCGC GCCGCCGCCT CGGAGCGCAA CATGGCCGAC 
GCCATCCGGT TTCTTTCCAT GGATGCCGTC GAGAAGGCCA ATTCCGGTCA TCCGGGCATG 
CCGATGGGCA TGGCGGACGC GGTTACCGTG CTCTTCAACC GCTTCATCAG AATCGATCCG 
TCGCTCCCCG ACTGGCCCGA CCGCGACCGT TTCGTGCTTT CGGCCGGCCA TGGCTCGATG 
CTGCTCTATT CCCTCCATCA CCTCATCGGC TTTGCGGACA TGCCGATGGC CGAGCTTTCG 
TCCTTCCGGC AACTCGGCTC GAAAACGGCC GGCCATCCCG AATACGGCCA TGCCCTCGGC 
ATCGAGACCA CCACCGGCCC GCTGGGCCAG GGGATCTCGA CCGCTGTCGG GATGGCGATG 
GCCGAACAGA TGATGGCCTC CCGGTTCGGC AGTGCTCTGT GCAACCACTT CACCTATGTC 
GTAGCCGGCG ACGGCTGCCT TCAGGAAGGC ATCAGCCACG AGGCTATCGA CCTTGCCGGA 
CATTTAAAGC TGCGCAAGCT GGTCGTGCTG TGGGACGACA ACCGAATATC GATCGACGGA 
TCGACGGATC TCTCTACCTC GATGAACCAG CTCGCGCGTT TCCGCGCCGC CAGCTGGGAC 
GCCCAAGCCG TCGATGGCCA CGACCCGGAA GCGGTTGCGA AAGCCCTGGA AAGAGCACGC 
CGGACCCGCA AGCCGTCGCT GATCGCCTGC CGCACCCGGA TCGGCAAGGG TGCAGCCAGC 
ATGGAAGGCT CGCACAAAAC CCACGGCGCG GCGCTCGGCG ACAAGGAAAT CGCAGCCACA 
CGCGAAAAAC TTGGCTGGCC GCATCCGCCC TTCTTCGTTC CGCCTGAGAT AAGGGCTGCC 
TGGGCAAAGG TGGCGGCTCG AGGTCGCACG GCTCGCGAGG CCTGGGATAT CCGCCTCGAC 
GCCTCGCGCT CGAAAAAGCG CTACGAGCAG ACCATAAGGC GGCAGTTTGA CGGCGAACTC 
GGCGATCTGC TTGCAAAATT CCGGAGCGCG CATCGCACAA GGGCTACGAA AGTTGCGACG 
CGTCAGGCCT CGCAGATGGC GCTGGAGGTC ATAAACGGCG CGACCGCTTT GACGATCGGC 
GGCTCGGCCG ACCTGACCGG CTCCAACCTG ACGATGACCT CGCAGACCCA GCCCATCTCG 
CCGGGCAATT TCAAGGGCCG TTATCTGCAT TACGGCATCC GCGAGCACGG CATGGCGGCC 
GCTATGAACG GCATCGCGCT TCATGGCGGC TTCATCCCCT ATGGCGGCAC TTTCCTGGTC 
TTCTCCGACT ATGCCCGCGG TGCGATGCGC CTCTCGGCCC TGATGGGCCT GCCCGTCATT 
TACGTGCTGA CGCATGATTC CATCGGGCTC GGCGAGGACG GACCGACCCA CCAGCCGGTC 
GAGCATCTGG CCATGCTGCG CGCCACGCCC AACCTCAACG TTTTCCGGCC GGCCGACATC 
ATCGAGACGG CAGAATGCTG GGAGATCGCG CTTGGCGAGA AGAATACGCC GAGCGTCCTC 
GCCCTTTCGC GTCAGGCCCT GCCGATGCTG CGCCGGACGG AAGGCAACGA GAACCAGTCG 
GCGCTCGGGG CGTATGTTCT GAGGGAAGCG CGCGGCAACC GGGACATCAC GATCCTTGCC 
ACGGGATCCG AAGTCGAGAT CGCCGTCGCT GCCGCCGAGC GCCTGCAGGC CGAGGAAGGC 
ATCGCGGCGG CAGTGGTCTC CATGCCCTGC TGGGAGAAGT TCGAGGTTCA GGACCTTGCC 
TATCGGAGGA AGGTCCTCGG CGACGCGCCC CGCATCGCCA TCGAGGCGGC GGGCCGGCTC 
GGCTGGGACC GATGGATGGG GCCGGACGGT GCCTTCGTCG GCATGACCGG CTTTGGTGCC 
TCGGCACCGG CAGGCGACCT CTACCGGCAT TTCGGCATTA CCGCCGACCA TGTCGTCGCA 
GAAGCCCTGG AGCTTCTCCG CCGCGCATAC TCGGAAACTC TGCCCATAGG TGCCCGGATC 
GGTCCGCACC CATCCGCACA CACCGTCAGA TCATCGCAGG AGGCATGA

Protein sequence

MNVSQQIEPR AAASERNMAD AIRFLSMDAV EKANSGHPGM PMGMADAVTV LFNRFIRIDP 
SLPDWPDRDR FVLSAGHGSM LLYSLHHLIG FADMPMAELS SFRQLGSKTA GHPEYGHALG 
IETTTGPLGQ GISTAVGMAM AEQMMASRFG SALCNHFTYV VAGDGCLQEG ISHEAIDLAG 
HLKLRKLVVL WDDNRISIDG STDLSTSMNQ LARFRAASWD AQAVDGHDPE AVAKALERAR 
RTRKPSLIAC RTRIGKGAAS MEGSHKTHGA ALGDKEIAAT REKLGWPHPP FFVPPEIRAA 
WAKVAARGRT AREAWDIRLD ASRSKKRYEQ TIRRQFDGEL GDLLAKFRSA HRTRATKVAT 
RQASQMALEV INGATALTIG GSADLTGSNL TMTSQTQPIS PGNFKGRYLH YGIREHGMAA 
AMNGIALHGG FIPYGGTFLV FSDYARGAMR LSALMGLPVI YVLTHDSIGL GEDGPTHQPV 
EHLAMLRATP NLNVFRPADI IETAECWEIA LGEKNTPSVL ALSRQALPML RRTEGNENQS 
ALGAYVLREA RGNRDITILA TGSEVEIAVA AAERLQAEEG IAAAVVSMPC WEKFEVQDLA 
YRRKVLGDAP RIAIEAAGRL GWDRWMGPDG AFVGMTGFGA SAPAGDLYRH FGITADHVVA 
EALELLRRAY SETLPIGARI GPHPSAHTVR SSQEA