Gene Smed_0227 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0227
Symbol
ID	5321059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	251880
End bp	252860
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	62%
IMG OID	640789162
Product	monosaccharide-transporting ATPase
Protein accession	YP_001325921
Protein GI	150395454
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.154077
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.0935895
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGCCA AGCTCCTCAA GAACCGTGAA ATCCTGCTCG TCGTTGCGAT TGCGGTGCTG 
CTCGCTATCA TCGCCTTGCG CTTCCCGGCT TTCGTGGCGC CGTCCAATCT CGCGCGCGTC 
TATAACGACA CCTCGATCCT CGTCATCCTG GCGCTTGGAC AGATGGCGGT TATTCTTACC 
CGCTGCATCG ACCTGTCGAT GGCGGCCAAC CTCGCGCTCT GCGGCATGGT GGCAGCCATG 
CTGAACAATT TCTTCCCCGG CCTGCCGATC CCACTCATCA TTTTTGCCGC CATGGCGCTG 
GGCGGGTTCC TCGGCGCGAT CAACGGTACG CTGGTCTGGA AGCTCAACAT TCCGCCGATC 
GTCGTGACCC TAGGGACTTT GACGATCTAC CGCGGTCTCA TCTTCGTTTT GACGAACGGC 
AAATGGATCA ATGCGCATGA GATGAGCGAC CCCTTCAAGG CGCTGCCGCG GCTGGTCGTC 
GCCGGCATGC CGGTGCTTTC CTGGCTCTCC TTCCTCATGA TAGCGCTGAT GTTCCTGGTC 
ATCGGACGTA CGCCGCTCGG CCGCGCCTTC TATGCCGTCG GGGGCAATCC GCATGCGGCC 
GTCTACACCG GCATCGATGT CGGCCGGACG CGCTTCTTCG CCTATTGTCT CTCGGGTACG 
CTTGCGGGCC TGTCAGGTTA TCTCTGGGTA TCGCGTTATG CCGTCGCCTA TGTGGACATC 
GCCGCCGGAT TCGAGCTCGA CATCATCGCG GCCTGCGTCA TCGGCGGCAT TTCGATTGCC 
GGCGGCATCG GCTCCGTGGC TGGTGCGGTG CTCGGAGCAC TCTTCCTCGG CGTGATCAAG 
AACGCGCTGC CGGTCATCGA TATCTCGCCC TTCGCGCAGT TGGCGATATC CGGAACGGTC 
ATCATCATCG CGGTTGCCGT CAATGCCCGC GCCGAGCGGC GCAAGGGCAG GGTCATTCTC 
AAGAAAGCGG AGGCGGTCTG A

Protein sequence

MMAKLLKNRE ILLVVAIAVL LAIIALRFPA FVAPSNLARV YNDTSILVIL ALGQMAVILT 
RCIDLSMAAN LALCGMVAAM LNNFFPGLPI PLIIFAAMAL GGFLGAINGT LVWKLNIPPI 
VVTLGTLTIY RGLIFVLTNG KWINAHEMSD PFKALPRLVV AGMPVLSWLS FLMIALMFLV 
IGRTPLGRAF YAVGGNPHAA VYTGIDVGRT RFFAYCLSGT LAGLSGYLWV SRYAVAYVDI 
AAGFELDIIA ACVIGGISIA GGIGSVAGAV LGALFLGVIK NALPVIDISP FAQLAISGTV 
IIIAVAVNAR AERRKGRVIL KKAEAV