Gene Smed_4908 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4908
Symbol
ID	5317885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1417869
End bp	1418831
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	60%
IMG OID	640776692
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001313624
Protein GI	150377028
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.852955
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTCA TGAAGGCACT TGCGAGTGCA ACGATCCTTG CTGCCTGCAC TTTCGGCAGC 
GCTTCGGCCG CGGATCTCGT CGTCGGCTTT TCTCAGATCG GATCGGAGTC CGGCTGGCGC 
GCAGCCGAGA CGACGCTGAC GAAACAGCAG GCAGAAGAGC GCGGCATCGA CCTCAAATTT 
GCCGATGCGC AGCAGAAACA GGAAAACCAG ATCAAGGCAA TCCGTTCCTT TATCGCCCAG 
GGCGTGAACG CGATTCTTCT GGCCCCGGTC GTGGCGACCG GCTGGGATGA AGTGCTGGAA 
GAGGCGAAGG ATGCGGAAAT CCCGGTCATA CTGCTCGACC GAACCGTCGA CGCTTCAAAG 
GATCTTTATC TGACTGCAGT CACGTCCGAT CTCGTTCACG AAGGCAGCGT GGCCGGCAAA 
TGGCTTGTCG ACACCGTTGC GGGCAAGCCG TGCAACGTCG TCGAACTCCA GGGCACCACC 
GGCTCCTCGC CGGCCATCGA CCGCAAGAAG GGCTTTGAGC AGGCGCTCTC CGGCAACGAC 
AATCTGAAGA TCGTGCGTAG CCAGACAGGC GATTTCACCC GCACGAAGGG CAAGGAAGTG 
ATGGAAAGCT TCCTCAAGGC CGAGGACGGC GGCAAGAACA TCTGTGCGCT CTACGCCCAT 
AACGACGATA TGGCGGTGGG CGCGATCCAG GCGATCAAGG AAGCCGGCCT GAAGCCCGGC 
AAGGACATCC TCGTCGTCTC AATCGACGCT GTGCCCGACA TCTTCCAGGC TATGGCCGCC 
GGAGAAGCAA ATGCGACGGT CGAGCTCACG CCAAACATGG CAGGCCCTGC CTTCGATGCA 
CTTGCAGCCT ACCTCAAGGA CGGCAAAGAG CCTCCGAAGT GGATCCAGAC GGAATCGAAG 
CTCTACACCC AGGCCGACGA TCCGATGAAG GTCTACGAAG AAAAGAAGGG TCTCGGTTAC 
TGA

Protein sequence

MKLMKALASA TILAACTFGS ASAADLVVGF SQIGSESGWR AAETTLTKQQ AEERGIDLKF 
ADAQQKQENQ IKAIRSFIAQ GVNAILLAPV VATGWDEVLE EAKDAEIPVI LLDRTVDASK 
DLYLTAVTSD LVHEGSVAGK WLVDTVAGKP CNVVELQGTT GSSPAIDRKK GFEQALSGND 
NLKIVRSQTG DFTRTKGKEV MESFLKAEDG GKNICALYAH NDDMAVGAIQ AIKEAGLKPG 
KDILVVSIDA VPDIFQAMAA GEANATVELT PNMAGPAFDA LAAYLKDGKE PPKWIQTESK 
LYTQADDPMK VYEEKKGLGY