Gene Smed_3960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3960
Symbol
ID	5318194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	407867
End bp	408994
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	61%
IMG OID	640775769
Product	ABC transporter periplasmic solute-binding protein
Protein accession	YP_001312702
Protein GI	150376106
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAGGA ACAGCAAAGT GGGCCCGGCG ACCATCGCCA CGGTCGGTTT GATGGCCGGG 
CTAATCGGGG CAAAAGCTGT TGCGGCGGGC GGGTTTGATC TGAACCGTCT GATCGAGGCG 
GCAAAGAACG AGAAACCGAT CACCATCTAT GACAGCACCG GCAAGATCGT CGAGATGGCA 
GAGAATTTCA ACGCTAAATA CGGGCTGAAA GCGACCGGCA TGAAGGTGTC GGCGAACAGC 
CAGCTGGAAA TGATCATCCG GGAGGCGCAG GCGAACAATG TGCAGGGCGA CGTGGTCCTG 
ATTACCGATG CGCCGGCGGC GCTTGCGCAG CTTCTGCCGG ACGAGTTCGT CGAGAGCTAT 
CTGCCGGAGG ATATGGCCGC AAAAATACCG CCGGAGTTCC AGAAGCCGCT GGCGATTTCA 
ACCAATGCCA ACGTCTGGGC CTATAATACC GAAGCCTATG ACAAGTGTCC GGTCTCCAAC 
ATCTGGGAGC TGACCGAGCC GCAGTGGAGG GGCAAGGTCG CGCTCGTCGA TCCGCTGACG 
AAGAGCACTT ACACCGACTG GTTTAACCAG ATGGAGGCAC ATGGCGATGA CAAGGTTGCC 
GCCGCCTACA AGGCGCATTT CGGCCAGGAA TTGCGGTCGG AGGAGAAGAG CGCGTCCGCC 
GCCTGGGTCA AGGCCATGGC GCAGAACGCG CCGCTCGCGA CGGACGGCGA CGATCCAGTG 
GCCGAGGCCG TCGGCGCGCC GGGCCAGAAG GAGCCGTTCT TCGGTCTCCT GAGTTCGGCC 
AAATTCCGCG ACAACGAAGC CAAAGGCTAT AAGCTCGGCA TCTGCAAGGA GCTCGAGCCC 
TGGGTCGGCT GGACCTATGT CAAGCTGGGC CTGATCGCGT CGAAGACTTC AAGCCCGAAC 
GCCGCCAAGC TGTTCATCCA CTATATCCTG ACCGAGGAAG GCATCGCGCC GCAGATGAAG 
GACGGCAAGT TGCCGACCAA TACCGACATC AGGATGCCCG CGGACGAACC ATCCGGGTTG 
ATGGCCGTTT CCGACCGGCT CTTCGGCTAC GACGCTGCGA CGGGTCTCAG CGACTTCGAC 
CGTCGTGAGG AGTGGCAGGA CCTCTGGCGC ACCAATTACA GCAAATGA

Protein sequence

MSRNSKVGPA TIATVGLMAG LIGAKAVAAG GFDLNRLIEA AKNEKPITIY DSTGKIVEMA 
ENFNAKYGLK ATGMKVSANS QLEMIIREAQ ANNVQGDVVL ITDAPAALAQ LLPDEFVESY 
LPEDMAAKIP PEFQKPLAIS TNANVWAYNT EAYDKCPVSN IWELTEPQWR GKVALVDPLT 
KSTYTDWFNQ MEAHGDDKVA AAYKAHFGQE LRSEEKSASA AWVKAMAQNA PLATDGDDPV 
AEAVGAPGQK EPFFGLLSSA KFRDNEAKGY KLGICKELEP WVGWTYVKLG LIASKTSSPN 
AAKLFIHYIL TEEGIAPQMK DGKLPTNTDI RMPADEPSGL MAVSDRLFGY DAATGLSDFD 
RREEWQDLWR TNYSK