Gene Smed_0916 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0916
Symbol
ID	5321757
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	987231
End bp	988253
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	61%
IMG OID	640789856
Product	putative periplasmic binding ABC transporter protein
Protein accession	YP_001326606
Protein GI	150396139
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAAA AACTATCTTC AGGGGCGGGA TCGGCCGGTG TCGGCAGGCG TCTTTTCTTG 
AAATCCGCAG CAATCGGCGG CGCTGCCGCA GCCGGCGGAC TTGCAGCTCC GGCGATCGCT 
CAGGGCGCTA AACGGAAGGT GATCTTTGTC GCCCATGAGG ACATCCCCTT CTTTTCCCCG 
GTTCGTGCCG GGTTCAAGGA ATTCGGCAAG CTGCGAAACT GGGACACGCA GTTTCTCGCC 
CGTGGCACAC CGGCCAACGT CGCCGCAACC GTGCGGTTGC AAGTGGATGC GCTGAACTCC 
AGGCCGGACG CGGTCGGCTT TACCCGCATC AATGAAACCG CTTTCGATGA GAATATCATG 
CGGGCAAAGG ACGCCGGCAT TCCGATCGTG CTCTACAACG TGGCAAGCGA CGGCTACGAA 
AAGCTCGAAG TGCCTTTCGT CGGTCAGGAC TTCATTCCCG CCGGCCGCGT GAACGGCCTT 
CAGGCGGCCA TGTACGCGCA TCAACTGACC GGCAAGACCG AAGGCACGAT CCTGATCGAC 
AATCCTTCTC CCGGCGTCAG CGCGCTGGAA GAACGGGCGA CCGGCACGGA GCAGGGGATC 
GACGAATACA ACGGGAAGAA CGGCACCAAC TACAAGTACG AGACATTTAC CACCGCAAAC 
TCGCAGACCG AAGCGCTGTC GCGGATCGAT GCCAAGATGC GCGCGACGCC GGACGTGGTC 
GGTTTCGCCA GCACTGTTTC CGGAAACTGG TTCGCAGCAA TCTGGGCCGA AGATAACGGA 
ATGACCGGCA AGTTCGCCAA TGGGGGCTTC GACCTTATCC CCGGCGTTCT GGAGGCGATC 
GCGGCAGAAA CGTCCCACTG GGCGGTCGGA CAGAACCCCT ATGCTCAGGG CTGGGTCACC 
TCGTCACTGC TGGATATGCA GCTTGAGGCC GGATACCAGC CATTCGATTA CGATACCGGC 
GCGGAAGTCG TCGACAAATC CAACGTCGAG GCCGTGACCA AGCGCGAAGC GCGTTTCGGG 
TGA

Protein sequence

MNKKLSSGAG SAGVGRRLFL KSAAIGGAAA AGGLAAPAIA QGAKRKVIFV AHEDIPFFSP 
VRAGFKEFGK LRNWDTQFLA RGTPANVAAT VRLQVDALNS RPDAVGFTRI NETAFDENIM 
RAKDAGIPIV LYNVASDGYE KLEVPFVGQD FIPAGRVNGL QAAMYAHQLT GKTEGTILID 
NPSPGVSALE ERATGTEQGI DEYNGKNGTN YKYETFTTAN SQTEALSRID AKMRATPDVV 
GFASTVSGNW FAAIWAEDNG MTGKFANGGF DLIPGVLEAI AAETSHWAVG QNPYAQGWVT 
SSLLDMQLEA GYQPFDYDTG AEVVDKSNVE AVTKREARFG