Gene Smed_4889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4889
Symbol
ID	5318051
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1399372
End bp	1400373
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	61%
IMG OID	640776674
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_001313606
Protein GI	150377010
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.64177
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAAC TGCTTGCGTC TACATGTCTC ATGCTTTGCC TCACGGCGGG AGCATCGGCG 
TCGAATGCTG CCGAATGTGG GAGCGTCACC ATCGCCAGCA TGAACTGGCA GAGTGCCGAG 
GTCCTCTCGA ACCTGGACAA GTTCATTCTC AACGAAGGTT ACGGGTGCAG CGCCGAGATA 
ACGATTGGCG ATACCGTGCC GACAATTACC TCCATGGCGG AGAAAGGTCA GCCCGATATA 
GCACCCGAAG CCTGGATCGA CCTCCTGCCC GACGTCGTCA AGAAGGGGCA GGACGACGGT 
CGTATCGTCA CGGTCGGTTC CCCGTTGCCG GATGGCGGCG TGCAGGGCTG GTGGATTCCG 
AAGTATCTTG CCGACGCCCA CCCGGATATC AAAACAATCG GCGACGCTCT GAAGCACCCC 
GAGCTCTTCC CCGCCCCCGA GGATTCGAGC AAGGGCGCTC TGCTGAACGG ACCGCAGGGC 
TGGGGCGGCA CAGTCGTGAC GACGCAGCTT TTCAACGCGT TCGACGGCGA GAAAGCCGGA 
TTCACCCTGA TCGATACCGG CTCTGCCGCC GGCCTGGATG GCGCCATCGC CAAGGCGTAT 
GAGCGCAAGG AAGGTCTTTT TACCTATTAC TGGTCCCCGA CTGCCCTCCT CGGCAAATAC 
GAGATGGTCA AGCTCGAGCC CGGCGTTCCG CACGACTCGG CCGAGTGGAA GCGCTGCAAC 
ACGGTAGCGG ATTGCCCCGA TCCCAAACCG AACGCATGGC CCGTCGACAC GATCGTGACG 
CTGGTCGCCA AGCCCTTTTC CGAGCGGGTC GGCCCCGAGG TGATGGATTA TCTGACCAAG 
AGGTCCTGGA GCAACGAGAC CGTCAGCAAG TTGATGGCCT GGATGACCGA CAATCAGGCA 
AGCGGTGAAG AAGGTGCGAA GCGCTTCCTC GAAGAGAACC AAGACATGTG GTCGAAGTGG 
GTCTCGCCCG AGGCCGCGGA GAAGATCAAA GCCGCGCTCT GA

Protein sequence

MNKLLASTCL MLCLTAGASA SNAAECGSVT IASMNWQSAE VLSNLDKFIL NEGYGCSAEI 
TIGDTVPTIT SMAEKGQPDI APEAWIDLLP DVVKKGQDDG RIVTVGSPLP DGGVQGWWIP 
KYLADAHPDI KTIGDALKHP ELFPAPEDSS KGALLNGPQG WGGTVVTTQL FNAFDGEKAG 
FTLIDTGSAA GLDGAIAKAY ERKEGLFTYY WSPTALLGKY EMVKLEPGVP HDSAEWKRCN 
TVADCPDPKP NAWPVDTIVT LVAKPFSERV GPEVMDYLTK RSWSNETVSK LMAWMTDNQA 
SGEEGAKRFL EENQDMWSKW VSPEAAEKIK AAL