Gene Smed_4266 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4266
Symbol
ID	5319017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	754573
End bp	755598
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	61%
IMG OID	640776071
Product	monosaccharide-transporting ATPase
Protein accession	YP_001313004
Protein GI	150376408
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.525278
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAGCA ATGTCGCAGC GCAGGGCACG AATTCGCCCC TCGTTCGCTC AAGACGGCGC 
ATGCCGCCCG AACTCAGCAT CTTTCTGGTG CTGATCGGTA TCGCGCTCGT CTACGAGATT 
CTTGGCTGGC TCTTCGTCGG CCAGAGCTTT CTGATGAATA CGCAGCGTCT GACGATCATG 
ATTCTGCAGG TCTCGGTTAT CGGCATTATC GCCGTGGGAG TCACCCAGGT CATCATCACT 
GGCGGCATCG ACCTTTCGTC GGGCTCGGTC GTCGGCATGA CGGCGATGAT CTCGGCAAGC 
GTCGCCCAGG CCTCCACATG GCCGAGGGCG CTTTATCCGT CGCTGACGGA CCTGCCGGCT 
ATCATACCGA TCGGCCTCGG CGTCGGGATC GGCCTTCTCG CCGGCTTCAT TAATGGTCAG 
CTGATCGCCA GAACCAAGAT CCCGCCCTTC ATTGCCACGC TGGGAATGAT GGTATCGGCT 
CGCGGCGTCT CCAAGTGGTA CACGAAGGGC CAGCCGGTCT CCGGCCTCAC CGAGCAGTTC 
AACTTCATCG GCACAGGCAT CTGGCCGGTT ATCGTCTTCC TCGTCGTCGC CCTTATATTT 
CACATCGCGT TGCGCTACAC CCGTTACGGC AAGTTTACCT ATGCGATCGG CGCCAATGTG 
CAGGCCGCGC GAGTCTCCGG CATCAATGTC GAAGCGCATC TGGTGAAGGT CTATGCGATC 
GCCGGCATGC TCGCCGGTCT GGCTGGCGTG GTCACCGCCG CGCGCGCCCA GACGGCGCAG 
GCCGGAATGG GGGTCATGTA TGAGCTCGAT GCGATCGCCG CGACCGTCAT CGGCGGCACT 
TCGCTGACCG GGGGCGTCGG CCGCATCACC GGGACGGTGA TCGGCACGGT GATCCTCGGC 
GTGATGACGT CCGGCTTCAC TTTCCTCAGG GTCGACGCCT ACTACCAGGA AATCGTCAAA 
GGCATCATCA TCGTCGCTGC GGTGGTCGTC GACGTGTATC GTCAGAAAAG CCGGAAAAAA 
GCGTAA

Protein sequence

MNSNVAAQGT NSPLVRSRRR MPPELSIFLV LIGIALVYEI LGWLFVGQSF LMNTQRLTIM 
ILQVSVIGII AVGVTQVIIT GGIDLSSGSV VGMTAMISAS VAQASTWPRA LYPSLTDLPA 
IIPIGLGVGI GLLAGFINGQ LIARTKIPPF IATLGMMVSA RGVSKWYTKG QPVSGLTEQF 
NFIGTGIWPV IVFLVVALIF HIALRYTRYG KFTYAIGANV QAARVSGINV EAHLVKVYAI 
AGMLAGLAGV VTAARAQTAQ AGMGVMYELD AIAATVIGGT SLTGGVGRIT GTVIGTVILG 
VMTSGFTFLR VDAYYQEIVK GIIIVAAVVV DVYRQKSRKK A