Gene Smed_5103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5103
Symbol
ID	5319405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	50652
End bp	51542
Gene Length	891 bp
Protein Length	296 aa
Translation table	11
GC content	59%
IMG OID	640776881
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_001313813
Protein GI	150377218
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1732] Periplasmic glycine betaine/choline-binding (lipo)protein of an ABC-type transport system (osmoprotectant binding protein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.257354
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTTCG CACCGAAACT TGCCAAGACC CTTCTATCGG CGGCGGCGAT CGCGTTCATC 
ACGACGACCG CCTGGGCCGC CACGCTTACC GTAGGCGGGA AGAACTTCAC CGAGCAGCTG 
ATCATCGCAG AGATCACGAA GCAGCTCCTC GAGAGCAAGG GCCACACCGT CGACAAGAAG 
GACGGCATGG GCACCAAGAT CGTTCGCGCC GCACTGGAGA ACGGCGAGGT CGATCTCTAC 
TGGGAGTATA CGGGGACGTC GCTCATCACC TTCAACAAGG TGATGGAACG GCTTTCGCCG 
GAGGAGACCT ATAGCCGCGT CAAGGAACTT GACGGCGAAA AAGGACTTGT CTGGCTGGCA 
CCGTCCGCGG CCAACAACAC CTACGCCTAT GTCATCAAGC CTGATAATGC CAAGACGGAG 
GGCATGGAGA CGATTTCGGA TCTCGCCAAG GCATATAATG ACGGCAAGAA AATCCTCATG 
GGCACTACGG CCGAATTTCC GAAGCGCCCG GACGGCCTGA TCGGCCTGGA AAAGGTCTAC 
GGTTTCGAGA CCGGGCGCGC CAATGTGCGC CCGATGGATC TTGGTCTCGC CTATAACGCG 
CTGGCCAATG GCGACCTCGA CACGATCGCC GCGCAGGCGA CCGACGGCCA GATCGCTGCA 
CTCGGCCTGA AGGTGCTGAA GGACGACAAG GGCTTCTTCC CCAACTATGC GCTCACCCCG 
GTCGTCCGCA AGGAAGTGCT CGACGCGAAT CCCGATCTCA AGGAGACGCT GGAAGCAGTC 
TCGATGAAGC TCGATGACGC GACCATGCAG CGTTTGAACA GCGAGGTCGA TGTGGAGAAG 
AAGACCATCG AGGCCGTGGC CGCCGACTAC CTGAAATCGC TGGGCATGTA A

Protein sequence

MNFAPKLAKT LLSAAAIAFI TTTAWAATLT VGGKNFTEQL IIAEITKQLL ESKGHTVDKK 
DGMGTKIVRA ALENGEVDLY WEYTGTSLIT FNKVMERLSP EETYSRVKEL DGEKGLVWLA 
PSAANNTYAY VIKPDNAKTE GMETISDLAK AYNDGKKILM GTTAEFPKRP DGLIGLEKVY 
GFETGRANVR PMDLGLAYNA LANGDLDTIA AQATDGQIAA LGLKVLKDDK GFFPNYALTP 
VVRKEVLDAN PDLKETLEAV SMKLDDATMQ RLNSEVDVEK KTIEAVAADY LKSLGM