Gene SbBS512_E4397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4397
Symbol	sbp
ID	6269901
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	4103674
End bp	4104663
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	51%
IMG OID	641728198
Product	sulfate transporter subunit
Protein accession	YP_001882611
Protein GI	187732736
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAGT GGGGCGTAGG GTTAACATTT TTGCTGGCGG CAACCAGCGT TATGGCAAAG 
GATATTCAGC TTCTTAACGT TTCATATGAT CCAACGCGCG AATTGTACGA ACAGTACAAC 
AAGGCATTCA GCGCCCACTG GAAACAGCAA ACTGGTGATA ACGTGGTGAT GCGTCAGTCA 
CACGGTGGTT CAGGTAAACA AGCGACGTCG GTAATCAACG GTATTGAAGC TGATGTTGTC 
ACGCTGGCTC TGGCCTATGA CGTGGACGCA ATTGCGGAAC GCGGGCGGAT TGATAAAGAG 
TGGATCAAAC GTCTGCCGGA TAACTCCGCA CCGTACACTT CCACCATTGT TTTCCTGGTG 
CGTAAGGGCA ATCCGAAGCA GATCCATGAC TGGAACGATC TGATTAAACC GGGTGTTTCG 
GTGATCACGC CTAATCCGAA AAGCTCTGGT GGCGCACGCT GGAACTACCT GGCTGCCTGG 
GGCTACGCGC TGCATCACAA CAACAACGAT CAGGCAAAAG CACAGGATTT TGTTCGGGCA 
CTGTATAAAA ACGTCGAAGT TCTGGATTCT GGCGCGCGCG GCTCCACTAA CACCTTTGTC 
GAGCGCGGGA TTGGCGATGT ACTGATCGCC TGGGAAAACG AAGCTCTGCT GGCAGCGAAT 
GAACTGGGGA AAGATAAATT CGAAATCGTC ACGCCGAGTG AGTCTATCCT CGCAGAGCCA 
ACCGTGTCGG TGGTCGATAA AGTGGTCGAG AAAAAAGGCA CCAAAGAGGT GGCGGAAGCC 
TACCTGAAAT ATCTCTACTC GCCAGAAGGT CAGGAAATTG CCGCGAAAAA CTACTACCGT 
CCGCGCGACG CTGAAGTAGC GAAAAAGTAC GAAAATGCGT TTCCAAAGCT GAAGTTATTC 
ACCATTGATG AAGAGTTCGG CGGCTGGACG AAAGCGCAAA AAGAGCATTT TGCTAACGGC 
GGTACGTTCG ATCAGATCAG CAAACGCTGA

Protein sequence

MNKWGVGLTF LLAATSVMAK DIQLLNVSYD PTRELYEQYN KAFSAHWKQQ TGDNVVMRQS 
HGGSGKQATS VINGIEADVV TLALAYDVDA IAERGRIDKE WIKRLPDNSA PYTSTIVFLV 
RKGNPKQIHD WNDLIKPGVS VITPNPKSSG GARWNYLAAW GYALHHNNND QAKAQDFVRA 
LYKNVEVLDS GARGSTNTFV ERGIGDVLIA WENEALLAAN ELGKDKFEIV TPSESILAEP 
TVSVVDKVVE KKGTKEVAEA YLKYLYSPEG QEIAAKNYYR PRDAEVAKKY ENAFPKLKLF 
TIDEEFGGWT KAQKEHFANG GTFDQISKR