Gene Smed_2134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2134
Symbol
ID	5322994
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2200942
End bp	2202036
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	63%
IMG OID	640791072
Product	extracellular solute-binding protein
Protein accession	YP_001327802
Protein GI	150397335
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.575498
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.605089
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCAAC GCCTGCTCTC GCTTTCGACC GCCATGCTGC TCGCTACGAC GGCAGTTGCC 
GTTGCCGAGC CGAGCGAGGA GCTCATCGCA GCCGCCAAGA AGGAAGGCAC GCTGACGACA 
ATCGCGCTCC CGCACAATTG GTGCGGGTAT GGAGACGTGA TCGCCGGCTT CAAGGCCAAA 
TACGGTATCG AAGTCAACGA ACTGAACCCG GATGCGGGCT CCGGCGACGA GATCGAGGCG 
ATCAAGGCCA ACAAGGGCAA CACCGGCCCG CAAGCACCCG ATGTCATCGA CGTCGGCCTG 
TCCTTCGGCC CCTCGGCCAA GGCCGAAGGC CTGATCCAGC CCTACAAGGT TTCGACCTGG 
GATACGATTC CGGACACGGC GAAGGACCCG GAGGGCTATT GGTACGGCGA TTACTACGGC 
GTTCTCTCCT TCGTGGTGAA CACCGATATC GTCAAGGATG TGCCGAAGGA CTGGGCGGAC 
CTCAAAAAGT CCGACTATGC GAATTCGGTT GCGCTCGCCG GCGATCCGCG GGCATCCAAC 
CAGGCGGTAC AGGCGGTCTA CGCAGCCGGC CTCGCGGCCG GTGAGACGGA TGCGGCCAAA 
GCGGGCGAAG CCGGTCTTGC CTTCTTCGCC GAGGTCAACA AGGCCGGCAA CTTCGTCCCT 
GTGATCGGCA AGTCCGCCTC CCTTGCGCAA GGATCGACCC CGATCATCAT CGCCTGGGAC 
TATAACGGCC TCTCCTGGCG CGACAGCCTG AACGGCAACC CGCCGGTCGA GGTCGTCGTT 
CCAGCCTCCG GTGTCGTCGC CGGCGTCTAC GTCCAGGCGA TCTCGGCCTT CGCGCCGCAT 
CCGAACGCGG CCAAGCTCTG GATGGAATAT CTGTATTCGG ACGAAGGTCA GCTCGGCTGG 
CTGAAGGGCT ATTGCCACCC GATCCGCTTC AACGACCTCG TCAAGAACGG CAAGGTTCCG 
CAGGAAATGC TCGACAAGCT GCCGCCGGCG GCATCCTACG AGAAGGCCGT CTTCCCGACG 
CTCGAAGAGC AGGAAGCCGG CAAGGCAGCG ATCACCACGA AGTGGGATAG CGTCGTCGGC 
GCGAGCGTAC AGTAG

Protein sequence

MTQRLLSLST AMLLATTAVA VAEPSEELIA AAKKEGTLTT IALPHNWCGY GDVIAGFKAK 
YGIEVNELNP DAGSGDEIEA IKANKGNTGP QAPDVIDVGL SFGPSAKAEG LIQPYKVSTW 
DTIPDTAKDP EGYWYGDYYG VLSFVVNTDI VKDVPKDWAD LKKSDYANSV ALAGDPRASN 
QAVQAVYAAG LAAGETDAAK AGEAGLAFFA EVNKAGNFVP VIGKSASLAQ GSTPIIIAWD 
YNGLSWRDSL NGNPPVEVVV PASGVVAGVY VQAISAFAPH PNAAKLWMEY LYSDEGQLGW 
LKGYCHPIRF NDLVKNGKVP QEMLDKLPPA ASYEKAVFPT LEEQEAGKAA ITTKWDSVVG 
ASVQ