Gene Smed_4738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4738
Symbol
ID	5319106
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	1259709
End bp	1260713
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	62%
IMG OID	640776536
Product	monosaccharide-transporting ATPase
Protein accession	YP_001313468
Protein GI	150376872
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.419907
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00245002
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGACGA TCGAGACACA GGCCACCGCG GGCACCGTCC CCTCCGGCAA ACGCTTCTTC 
ACACTGGCCG GACGATACGG CACTGTCGCC GCGTTCCTCG CACTGATCCT CTTCAACGTC 
CTCTTCACTC CAAACTTCCT GTCTTTGCAG ACGCTCAACG TCAACCTGAC CCAGGTCGCC 
ACGATCGTGA TCGTCGCCAC CGGCATGACA CTGGTGATTG CTACCGGCGG CATCGACCTT 
TCGGTGGGTT CACTGATGGC GATAGGCGGT GCGCTTGCAC CGATGATCTT TATGGGCGCG 
CTGTTTCCGG TTTCGTCCAT GCCCGTCGCC GTGGCACTTG CCTTTATTCT GCCGGTCATC 
GCCACGGCGC TGCTCGGTTT GTTCAACGGG CTGCTGGTGA CTCGTTTCGC CATCCAGCCG 
ATCATCGCCA CCCTCGTCCT GTTCATTGCC GGCCGCGGCA TCGCCCAGGT CATGACCAAC 
GGCAACCTGC AGGTCTTCCG CAACGAAGGC TTCCAATTCA TAGCTCTCGG GCGCATTGCC 
GGCATTCCCG CCCAGGTAAT TTTGATGATT GTGATTGCGG CGATCGCATG GGCGGCAGTT 
CGCCACACGG TTTTTGGACG CCAGGTCATC GCGGTCGGGG GCAACGAGAA GGCAGCCCGG 
CTGACCGGTA TCCCCGTGCA CCGCGTCAAA CTGCTCGTCT ATATGATCAG CGGCGCGCTT 
GCCGGCGTGG CGGGCCTCAT CGTCGTCGCG CGGAATTCCG CAAGCGATGC AAACCTTGTC 
GGCCTCGGCA TGGAACTAGA CGCAATCGCC GCCGTCGCCG TAGGCGGCAC GCTTCTGACC 
GGCGGGCGCG CGAACATCAT GGGCACCTTG ATCGGCGCCC TGGTTATCCA GCTGGTGCGC 
TACACCCTGC TTGCAAATGG TGTGCCCGAC GCGGCTGCGC TGATCGTCAA GGCTGCCCTG 
ATCCTGCTTG CGGTATTCAT CCAGCAGCGT GCCGGAAAAC CGTGA

Protein sequence

MTTIETQATA GTVPSGKRFF TLAGRYGTVA AFLALILFNV LFTPNFLSLQ TLNVNLTQVA 
TIVIVATGMT LVIATGGIDL SVGSLMAIGG ALAPMIFMGA LFPVSSMPVA VALAFILPVI 
ATALLGLFNG LLVTRFAIQP IIATLVLFIA GRGIAQVMTN GNLQVFRNEG FQFIALGRIA 
GIPAQVILMI VIAAIAWAAV RHTVFGRQVI AVGGNEKAAR LTGIPVHRVK LLVYMISGAL 
AGVAGLIVVA RNSASDANLV GLGMELDAIA AVAVGGTLLT GGRANIMGTL IGALVIQLVR 
YTLLANGVPD AAALIVKAAL ILLAVFIQQR AGKP