Gene Smed_0226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0226
Symbol
ID	5321058
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	250372
End bp	251883
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	64%
IMG OID	640789161
Product	ABC transporter related
Protein accession	YP_001325920
Protein GI	150395453
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.973654
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.104566
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCCCG CCATCGCGCT TGAGGGCATA TCGAAGTCCT TTCCGGGCGT GCGCGCGCTT 
TCCGATGTCT CACTCGCGCT CTATCCGGGC TCGGTGACGG CGCTCGTCGG CGAGAACGGC 
GCCGGCAAGT CGACCCTCGT GAAGATACTG ACCGGCATTT ATCAACCCGA TGCGGGCGCA 
ATCCGGCTCG CTGACAGGGA GACGACATTT CCGACAGCCC TTGCCGCGTC CCGCGCCGGC 
GTGACCGCGA TCCACCAGGA GACGGTCCTC TTCGACGAGC TCTCCGTCGC GGAGAATATT 
TTCCTCGGTC ATGCTCCGCG CAATCGCTTC GGCCTCATCG ACTGGAAGAA GCTCAACGCC 
GACGCCAAGA CCCTGTTGAA CCGGGCAGGC GCCGATTTCG ACCCGACGAT CCGCCTCCGC 
GACCTCGGCA TCGCCAAGAA GCACCTGGTC GCGATCGCCC GGGCGCTCTC GGTCGATGCG 
CGCGTCGTCA TCATGGACGA GCCGACGGCC GCTCTGTCGC ACAAGGAAAT TCACGAGCTC 
TACGCGCTGA TCGAACGGCT CAAGGCCAAC GGCAAGGCCA TCCTCTTCAT CAGTCACAAA 
TTCGATGAGA TCTTCCGCAT CGCCGACCGC TACACCGTCT TCCGCGACGG AGCGATGATC 
GGCGAAGGGC TGATCGCCGA TGTCAGCCAG GACGATCTCG TCCGCATGAT GGTCGGCCGC 
GCGGTCGGCT CCGTGTACCC GAAGAAGGAG GTGGCCATCG GTCAGCCGGT GCTTACCGTT 
TCCGGTTATC GCCACCCGAC CGAATTCGAG GACATCAACT TCGAGCTCAG GCGCGGCGAG 
ATTCTCGGCT TCTATGGCCT CGTCGGCGCG GGACGTTCGG AGTTCATGCA GTCGCTGATC 
GGCATCACCC GGCCGTCGGC CGGTGCGGTC AAGCTCGATG GGGAGGTGCT GGTTATCCGC 
AGCCCGGCGG AGGCGATCCG CGCCGGCATC GTCTATGTGC CGGAAGAGCG CGGGCGGCAG 
GGGGCGATCA TCGGCATGCC GATCTTTCAG AACATCACGC TGCCATCGCT CTCGCAGACC 
TCGCGTTCGG GGTTCCTGAG GCTCGCCCAG GAATTCGCCT TGGCACGCGA ATATACCTCG 
CGTCTCGACC TGCGCGCCGC CTCGCTCGAT CAGGATGTCG GCACGCTGTC CGGTGGAAAC 
CAGCAGAAGG TGGTGATCGC CAAGTGGCTC GCCACCCGGC CGAAGGTCAT CATCCTCGAC 
GAGCCGACCA AAGGCATAGA CATCGGATCC AAGGCTGCCG TCCATGCCTT CATGAGCGAA 
CTCGCCGCCC AGGGCCTGAG CGTCATCATG GTATCCTCGG AAATCCCGGA GATCATGGGA 
ATGTCCGACC GCGTCATCGT CATGCGCGAG GGCCGCGTCG CCGGAAGGTT CGAACGATCG 
GAACTGACTG CCGAGAAGCT GGTGCGGGCT GCCGCGGGCA TCGAAACGCA AGCCGGCGGG 
GGAGCAGCAT GA

Protein sequence

MKPAIALEGI SKSFPGVRAL SDVSLALYPG SVTALVGENG AGKSTLVKIL TGIYQPDAGA 
IRLADRETTF PTALAASRAG VTAIHQETVL FDELSVAENI FLGHAPRNRF GLIDWKKLNA 
DAKTLLNRAG ADFDPTIRLR DLGIAKKHLV AIARALSVDA RVVIMDEPTA ALSHKEIHEL 
YALIERLKAN GKAILFISHK FDEIFRIADR YTVFRDGAMI GEGLIADVSQ DDLVRMMVGR 
AVGSVYPKKE VAIGQPVLTV SGYRHPTEFE DINFELRRGE ILGFYGLVGA GRSEFMQSLI 
GITRPSAGAV KLDGEVLVIR SPAEAIRAGI VYVPEERGRQ GAIIGMPIFQ NITLPSLSQT 
SRSGFLRLAQ EFALAREYTS RLDLRAASLD QDVGTLSGGN QQKVVIAKWL ATRPKVIILD 
EPTKGIDIGS KAAVHAFMSE LAAQGLSVIM VSSEIPEIMG MSDRVIVMRE GRVAGRFERS 
ELTAEKLVRA AAGIETQAGG GAA