Gene SbBS512_E4114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4114
Symbol	setC
ID	6270772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	3839107
End bp	3840141
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	46%
IMG OID	641727943
Product	sugar efflux transporter C
Protein accession	YP_001882374
Protein GI	187731533
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00899] sugar efflux transporter

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	0.741083
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAGGTT TTTTCTTCAC CGGTAGCGCT ATTATGGGAA TTCTGGTCAG TCAATTTCTG 
GCAAGGCACT CCGATAAACA AGGCGACCGT AAATTACTGA TTCTGCTATG TTGCTTATTT 
GGAGTGCTGG CCTGCACGCT TTTTGCGTGG AATCGCAACT ACTTCATTCT CCTCTCTACG 
GGCGTACTTC TGAGTAGTTT TGCTTCTACC GCAAACCCGC AAATGTTCGC CCTCGCCCGT 
GAACACGCCG ACAGAACAGG CCGTGAGACG GTCATGTTCA GTACATTTTT ACGTGCTCAG 
ATCTCGCTTG CCTGGGTTAT CGGGCCACCG CTCGCTTATG AACTGACAAT AAGGTTTAGT 
TTTAAAGTGA TGTATCTCAC CGCTGCCATC GCATTTGTTG TTTGCGGGCT GATAGTCTGG 
TTGTTTTTGC CATCAATACA AAGAAATATT CCTGTCGTTA CCCAACCCGT AGAAATTTTA 
CCCTCCACCC ATAGGAAGCG GGATACGCGG CTACTTTTTG TGGTCTGTTC AATGATGTGG 
GCGGCGAATA ATCTCTACAT GATAAATATG CCGCTATTTA TTATTGATGA ACTGCATCTA 
ACCGATAAAC TGGCTGGAGA AATGATTGGT ATCGCTGCCG GTCTGGAAAT TCCGATGATG 
TTAATCGCAG GCTATTACAT GAAACGTATT GGCAAGCGAC TATTAATGCT CATTGCTATC 
GTGAGTGGTA TGTGTTTTTA CGCCAGCGTA CTCATGGCGA CGACTCCGGC GGTTGAGCTG 
GAATTGCAAA TTCTAAATGC CATCTTCCTT GGTATTCTCT GTGGTATCGG CATGCTTTAT 
TTTCAGGACT TGATGCCTGA AAAAATAGGC TCTGCGACAA CGTTATATGC AAATACTTCA 
CGCGTCGGCT GGATTATCGC CGGCTCTGTT GACGGAATTA TGGTTGAAAT CTGGAGCTAC 
CATGCGTTGT TCTGGCTGGC GATAGGGATG TTGGGTATTG CGATGATTTG CCTGCTGTTT 
ATTAAAGATA TTTAG

Protein sequence

MVGFFFTGSA IMGILVSQFL ARHSDKQGDR KLLILLCCLF GVLACTLFAW NRNYFILLST 
GVLLSSFAST ANPQMFALAR EHADRTGRET VMFSTFLRAQ ISLAWVIGPP LAYELTIRFS 
FKVMYLTAAI AFVVCGLIVW LFLPSIQRNI PVVTQPVEIL PSTHRKRDTR LLFVVCSMMW 
AANNLYMINM PLFIIDELHL TDKLAGEMIG IAAGLEIPMM LIAGYYMKRI GKRLLMLIAI 
VSGMCFYASV LMATTPAVEL ELQILNAIFL GILCGIGMLY FQDLMPEKIG SATTLYANTS 
RVGWIIAGSV DGIMVEIWSY HALFWLAIGM LGIAMICLLF IKDI