Gene Smed_5887 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5887
Symbol
ID	5320189
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	851017
End bp	852063
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	62%
IMG OID	640777582
Product	monosaccharide-transporting ATPase
Protein accession	YP_001314514
Protein GI	150377919
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0742654
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.67986
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATTG AACAGAGCAA ACCGGCGGCG AGCCAGGCGA TTCCGTCGTC AGCTGGCGTG 
CGGGAAGCAG CGATAAGATA CGGCTTTCTC GTGCTTTTGG CCGGGATGAT CCTCTATTTC 
TCATTGGTCA CCGGTGGATT CGCCTCTCCG CAAAGCGCAG TTTTCATTCT GCAATCGGTC 
TCGATCACAG GCATCCTCGC GCTCGGCGTA ACGGCGACCC TGGTCGTCGG CGGCTTCGAC 
CTGTCGATAG GCTCCATCGC CACGACGGCG ATGATGGCCT CGTCCTACGT CATGGTCGTG 
CTGGGTGGGG ATGCTTTGAC GGCGACCCTC GTGTGCTTCT CGATCGGGGT TCTCATCGGG 
CTGATCAATG GCATCATTAT CGTCTACATG CGCGTGCCCG ACCTGCTCGC GACGCTCGGC 
ATGATGTTCC TGCTGCTCGG CCTTCAGCGC ATCCCGACAG AGGGACGCTC GATCGCCGCC 
GGCATGACCC TGCCCGACGG CACCGTTGCG CCCGGCACTT TCAGCCCTGC CTTTCTGGCG 
CTCGGGCGTC ATCGCTTCGA TTTCGTCCTG CCAAATCTCG TGCCGGTCTC TGTCGTGGTC 
CTGATTATTC TTGCGGTCGT TATCTGGTTC TTCCTCGAAT ATACGCGCTT CGGCCGGATG 
ATGTACGCCG TGGGCTCGAA CGAACGTGCC GCCAGCCTCG CGGGCGCGCC GGTCAATGCT 
TACAAAATCT GGGCCTATAT CATTTCCGGC GTCTTTGCCT CGATCGGCGG TATCCTGCTC 
GCGGCCCGCC TCGGCCGCGG GGATATCGCC TCCGGCAACA ACCTGCTGCT GGACGCCGTC 
GCCGCTGCGC TGATCGGTTT CGCCGTACTC GGTGCCACTA AGCCGAACGC CTTCGGCACG 
GCCGTCGGCG CGCTCTTCGT CGGCATCCTG CTGCAGGGCC TGACGATGAT GAACGCGCCC 
TACTACACCC AGGATTTCGT CAAGGGCGCG GTGCTGGTCA TTGCCCTGAT TTTCACCTTT 
GCGCTCTCGA AAAGAGGCAG ACGCTGA

Protein sequence

MSIEQSKPAA SQAIPSSAGV REAAIRYGFL VLLAGMILYF SLVTGGFASP QSAVFILQSV 
SITGILALGV TATLVVGGFD LSIGSIATTA MMASSYVMVV LGGDALTATL VCFSIGVLIG 
LINGIIIVYM RVPDLLATLG MMFLLLGLQR IPTEGRSIAA GMTLPDGTVA PGTFSPAFLA 
LGRHRFDFVL PNLVPVSVVV LIILAVVIWF FLEYTRFGRM MYAVGSNERA ASLAGAPVNA 
YKIWAYIISG VFASIGGILL AARLGRGDIA SGNNLLLDAV AAALIGFAVL GATKPNAFGT 
AVGALFVGIL LQGLTMMNAP YYTQDFVKGA VLVIALIFTF ALSKRGRR