Gene Smed_0102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0102
Symbol
ID	5320930
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	113078
End bp	114103
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	63%
IMG OID	640789034
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001325797
Protein GI	150395330
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0193785
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAGA CTGTTCTTTC TGCCGCATTC GGCGCGCTTG CACTCGGCGT GGCCTTCGCA 
TCGCCTTCGC AGGCGGCCGA CGTGTCGGCC TGCCTCATCA CCAAAACCGA CGCCAATCCT 
TTCTTTGCGA AAATGAAGGA AGGCGCGACC GCCAAGGCCA AGGAACTGGG CGTGGCCCTG 
AAGTCCTATG CCGGTAAGAT CGATGGAGAT TCCGAGAGCC AGGTTGCCGC GATCGAGACA 
TGCATCGCCG ACGGTGCGAA AGGTATTCTG ATCGCCGCCT CCGACACCCA GGGCATCGTG 
CCTCACGTCA AGAAGGCGCG GGACGCCGGT CTCCTGGTCA TCGCACTCGA TACGCCGCTC 
GAGCCGCTCG ACTCCGCCGA CGCGACCTTT GCAACGGACA ACCTGCTCGC CGGCAAGCTG 
ATCGGGCAAT GGGCTGCCGC AACGCTCGGC GACGCCGCCA AGGACGCCAA GGTGGCATTC 
CTCGACCTTA CGCCGTCTCA GCCTTCCGTC GACGTGCTGC GCGACCAGGG CTTCATGATC 
GGCTTCGGCA TCGACCCCAA GGACCCGAAC AAGATCGGCG ACGAGGATGA TCCGCGCATC 
GTCGGCCATG ACATCACCAA CGGCAACGAA GAAGGCGGCC GGTCTGCAAT GGAGAACCTC 
CTCCAGAAAG ATCCGACCAT CAATGTCGTC CACACGATCA ACGAACCGGC GGCCGCCGGC 
GCCTACGAGG CGCTGAAGGC TCTCGGCCGC GAGCAGGACG TGCTGATCGT TTCCGTCGAT 
GGCGGTTGCC CGGGGGTCAA GAACGTCGCC GAGGGTGCAA TCGGAGCGAC GTCGCAGCAA 
TACCCGCTGA TGATGGCGGC GCTCGGCATC GAGGCAATCA AGAAGTTCGC TGACACCGGC 
GAAAAGCCGG TGCCGACAGA GGGCAAGGAT TTCGTGGACA CGGGAGTCTC GCTCGTCACC 
GACAAGCCGG TTGATGGTCT GGAATCGATC GACACCAAGA CCGGCCTGGA GAAGTGCTGG 
GGCTGA

Protein sequence

MKKTVLSAAF GALALGVAFA SPSQAADVSA CLITKTDANP FFAKMKEGAT AKAKELGVAL 
KSYAGKIDGD SESQVAAIET CIADGAKGIL IAASDTQGIV PHVKKARDAG LLVIALDTPL 
EPLDSADATF ATDNLLAGKL IGQWAAATLG DAAKDAKVAF LDLTPSQPSV DVLRDQGFMI 
GFGIDPKDPN KIGDEDDPRI VGHDITNGNE EGGRSAMENL LQKDPTINVV HTINEPAAAG 
AYEALKALGR EQDVLIVSVD GGCPGVKNVA EGAIGATSQQ YPLMMAALGI EAIKKFADTG 
EKPVPTEGKD FVDTGVSLVT DKPVDGLESI DTKTGLEKCW G