Gene Smed_2042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2042
Symbol
ID	5322901
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2094538
End bp	2095524
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	59%
IMG OID	640790979
Product	monosaccharide-transporting ATPase
Protein accession	YP_001327710
Protein GI	150397243
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0809219
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.224374
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACAAC GTACGTTCCT GCAAAGCTTC GTCTCGAAGC CGGAATTCGG TCCGCTCGTG 
CTTCTGGTGC TCGAGCTTAT GGTCTTCTGG TCTTTCAACT CGGATTTTCT GTCGCTTCCG 
AACATCAGCA ATACGCTGTC CTTTACCGTC GAACTCGGCC TGATCGCACT GGCAATGACT 
TTGCTCATGA CGGCGGGTGA GTTCGATCTT TCGGTCGGCT CGGTATTCGG CTTCTCGGCT 
GTCCTGATGT GGACCTTGTT CAACAGCGAG ATGATGCCGC TCGGGGTCGC ATTCCTCGTG 
GCGATTGCCG CCAGTCTGCT GATCGGCTTT GTCAACGGAT GGTTCGTCAC GAAGCTGAAC 
ATACCGTCCT TCCTCGTGAC GCTCGGGATG CTCCTGGTCG TCCGAGGCAC CGCTCTCTAC 
GTCACCGACG GTTTCCCGCA GCGGACCTGG AATGCGGAAG GCAACCTGTT TGCCAACGTT 
CTGGCTGGAA GCTACTTCAT CGGCAGTTTC CGGATGTACA TGTCGGTGAT CTGGTTCGCG 
CTGGCAGCGG TTGCGGCACA TTACGTGCTC ACAAAGACAA AGGCTGGAAA CTGGATCCAG 
GCTTCGGGAG GCAATCCGAA CGCTGCACGC GCGCGCGGGG TCAACGTGAG CCGCACGAAG 
ATATGCCTGT TCATGGCATC ATCCGCGATG GCGTCGCTTG CCGGCATCAT CAGCTCCATC 
CGTACCTCTG CGGCCAACCC CAACAGCGGC ACCGGCTACG AGCTTGAGGT GATCGCCATG 
GTGGTGATCG GCGGCACCGT GCTCACCGGC GGCCGCGGGA CGATCATCGG CACGGTGCTC 
GGCATTTTCA TTCTGCGCGT CATGCGCAAC GGCATCGTCA TGATCGGCGT GCCCGGCCTT 
GCCTACAACA TCTTCATCGG CGCGATCATC CTCGGAATGA TGGCACTGCA CTCATGGCTG 
GAACGCCGAC ACAACTCAGG AGTATAA

Protein sequence

MQQRTFLQSF VSKPEFGPLV LLVLELMVFW SFNSDFLSLP NISNTLSFTV ELGLIALAMT 
LLMTAGEFDL SVGSVFGFSA VLMWTLFNSE MMPLGVAFLV AIAASLLIGF VNGWFVTKLN 
IPSFLVTLGM LLVVRGTALY VTDGFPQRTW NAEGNLFANV LAGSYFIGSF RMYMSVIWFA 
LAAVAAHYVL TKTKAGNWIQ ASGGNPNAAR ARGVNVSRTK ICLFMASSAM ASLAGIISSI 
RTSAANPNSG TGYELEVIAM VVIGGTVLTG GRGTIIGTVL GIFILRVMRN GIVMIGVPGL 
AYNIFIGAII LGMMALHSWL ERRHNSGV