Gene Smed_5193 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5193
Symbol
ID	5319495
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	148533
End bp	149474
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	59%
IMG OID	640776971
Product	extracellular solute-binding protein
Protein accession	YP_001313903
Protein GI	150377308
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.441941
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGCCG CACCGGGCAA AGGACGTCAA ACGGGACGAC GGATAGTCAG ATTTGGGCTG 
ACGCTAGGAG CAGTGACCGT CAGCATGTGG GCGACCGCAG AAGCACAGAC GCTCGATCGC 
GTCCGCAGCA GCAGCACCGT CAAGCTGGGC TACGATGCGA CCGCGCGGCC ATTCTCTTTC 
AAGGCCGAAG GAGAAAGCGC CACCGGCTAC GCCGTCAGCC TGTGCATGGA GGTGACCGAG 
GAATTGAAAC GTGAACTTGG GATTGCCGAT CTTGCGGTCG AGTGGATTGA GCTCACCAGG 
GATGCTGCCG ACAACGCCAT ACGACAAGGT TCGGCCGATC TCTTCTGTGG TGCGTCGCCC 
GTGACCTTGA CGCGCCGAAA GGAGGTTTCG TTCTCGATAC CGATCTTTCC GAGCGGAACG 
GGTGCGGTAC TGAGTGCGAG CGCACCACTT GCGTTGCGTG AGGTTCTGAC GCAGGGACGC 
CCTTCTGACC GGCCGATTTG GCGGGGGTCC CCCGCAAGAA CCGTGCTCAA TCAGAAGACA 
TTTTCCCCGA TCGCAGGTAC TACCAGTGAG GATTGGCTTG CGGAGCGGAT AAAGACGTTT 
CAGCTTTCAG CGACCATCGC TGCTGTGGAG AACTATGATC AGGGAATCGC CAATATTCTC 
AACGGCGAGT CCGACGTACT CTTCGGCGAC CTGCCGCTCT TGCTCGACGC CGCCGCGCGC 
GGCGAAAATT CCGGCGATCT CATCGTACTG AAGCGCCATT TCACCTACGA ACCGCTTGCG 
CTTGTGCTGG CGCGCAATGA CGAGGATTTT CGAATCGTCG TTGACCGAGC CTTGAGCCGC 
ACCTACCGAT CGGAAGATTT CCCGGCATTC TTCAGCGAGT GGTTCGGACC TCCTGACGAT 
ACGATCGTGA CCTTCTTCCG GCAAACGACC CTGCCTGAGT GA

Protein sequence

MQAAPGKGRQ TGRRIVRFGL TLGAVTVSMW ATAEAQTLDR VRSSSTVKLG YDATARPFSF 
KAEGESATGY AVSLCMEVTE ELKRELGIAD LAVEWIELTR DAADNAIRQG SADLFCGASP 
VTLTRRKEVS FSIPIFPSGT GAVLSASAPL ALREVLTQGR PSDRPIWRGS PARTVLNQKT 
FSPIAGTTSE DWLAERIKTF QLSATIAAVE NYDQGIANIL NGESDVLFGD LPLLLDAAAR 
GENSGDLIVL KRHFTYEPLA LVLARNDEDF RIVVDRALSR TYRSEDFPAF FSEWFGPPDD 
TIVTFFRQTT LPE