Gene Smed_5747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5747
Symbol
ID	5320049
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	714631
End bp	715782
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	65%
IMG OID	640777460
Product	putative integral membrane protein
Protein accession	YP_001314392
Protein GI	150377797
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.514564
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACGCT TAAAAGCGCT GACTTGGGAC CATCCGCGCG GCTATAACGC GCTGGCCGCC 
GCGGCTCGCC GATTGGATTT GGCCGAAAGC GGCCTGGCAA TCGACTGGGA CAAGCAGCCG 
CTTGAAGGAT TCGAGTCCTA TCCGATCGCC GATCTCTGCG CCCGTTACGA CCTGGTCGTG 
CTCGATCATC CCCATGTCGG CGAGGCGGTG GATGGCGATT GCCTGCAGCC GCTGGAGAGC 
ATCTTCGAGG AGGCGACGAT CAACCTGCTG AGAGCCGAGA GCATCGGCCC CTCCTTGCGC 
AGTTACCACT TCACTGGCCA ACACTGGGCC CTTCCGCTCG ATGCGGCGAC CCAGGTGATG 
GCTGCGCGCG CCGACCTGCT CGTCGGCCCC GCCCCCGTTC TCTGGGACGA GGTGCTGTTG 
CTGTCGCAGA AAACCGGCAA GGTGGCGCTG TCGCTGGCCG GACCGCATGC CGCACTCTCC 
TTCCTGTCGA TAGCCACGGC GCTCGGCGAG CCGCCGGCCG AGCGGGATCC AGACATTCTG 
GTCTCGGAGC AAGTCGGCAC CGAAGTCTAC GACCTAATGA ACGAGCTTGC GGCTCGCAGC 
CCGCATGTGG TTCGCCAAAA GAACCCGATC AGTATCCTCG AGCACATGGC GGCCCACGAC 
GACGTCGCCC TCGTGCCGCT GGTCTACGGC TACGTGAACT ATGCCGCGCC GGTAAGCGGC 
CGGCCGATCA CCTTCCACAA TGCGCCGCGG CTAGAACCTG GCGACCGTCC CGGCTCCACT 
CTCGGCGGCA CCGGAATCGG CATATCCCGC CGCTGCGAGG TGACGCCGGC ACTGAAGCGC 
CACCTGCTTT GGCTGATGAG CGCCGACGCG CAGATCGGCT TCATACCGTG CCATGAAGGT 
CAGCCGTCCC GGCGGGAAGC CTGGCATGAT GCAGGCGTGA ATGCCCGCTG GGGCAGGTTC 
TATTCGAACA CCGTCGCCAC GCTGGAGCAG GCCTATGTGC GTCCGCGCCA CAACGGCTAC 
ATCGCGTTCC AAAGCAGGGC TTCCGCCCTG CTGCGCGAGT CATTCCTCGA GAATGCGCCG 
GCCAGGGGCG TGATCAACCG ACTCCAGACA CTTTATGCAG ATCATCGCGG CAGCAAGGGC 
GGCGAAAGGT AG

Protein sequence

MQRLKALTWD HPRGYNALAA AARRLDLAES GLAIDWDKQP LEGFESYPIA DLCARYDLVV 
LDHPHVGEAV DGDCLQPLES IFEEATINLL RAESIGPSLR SYHFTGQHWA LPLDAATQVM 
AARADLLVGP APVLWDEVLL LSQKTGKVAL SLAGPHAALS FLSIATALGE PPAERDPDIL 
VSEQVGTEVY DLMNELAARS PHVVRQKNPI SILEHMAAHD DVALVPLVYG YVNYAAPVSG 
RPITFHNAPR LEPGDRPGST LGGTGIGISR RCEVTPALKR HLLWLMSADA QIGFIPCHEG 
QPSRREAWHD AGVNARWGRF YSNTVATLEQ AYVRPRHNGY IAFQSRASAL LRESFLENAP 
ARGVINRLQT LYADHRGSKG GER