Gene EcE24377A_4451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4451
Symbol	sbp
ID	5586871
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	4436507
End bp	4437496
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	51%
IMG OID	640928066
Product	sulfate transporter subunit
Protein accession	YP_001465410
Protein GI	157157089
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAGT GGGGCGTAGG GTTAACATTT TTGCTGGCGG CAACCAGCGT TATGGCAAAG 
GATATTCAGC TTCTTAACGT TTCATATGAT CCAACGCGCG AATTGTACGA ACAGTACAAC 
AAGGCATTCA GCGCCCACTG GAAACAGCAA ACTGGTGATA ACGTGGTGAT TCGTCAGTCA 
CACGGTGGTT CAGGTAAACA AGCGACGTCG GTAATCAACG GTATTGAAGC TGATGTGGTC 
ACGCTGGCTC TGGCCTATGA CGTGGACGCG ATTGCGGAAC GCGGGCGGAT TGATAAAGAG 
TGGATCAAAC GTCTGCCGGA TAACTCCGCA CCGTACACTT CCACCATTGT TTTCCTGGTG 
CGTAAGGGCA ATCCGAAGCA GATCCATGAC TGGAACGATC TGATTAAACC GGGTGTTTCG 
GTGATCACGC CTAATCCGAA AAGCTCTGGT GGCGCACGCT GGAACTACCT GGCTGCCTGG 
GGCTACGCGC TGCATCACAA CAACAACGAT CAGGCAAAAG CACAGGATTT TGTTCGGGCA 
CTGTATAAAA ACGTCGAAGT TCTGGATTCT GGCGCGCGCG GCTCCACTAA CACCTTTGTC 
GAGCGCGGGA TTGGCGATGT ACTGATCGCC TGGGAAAACG AAGCTCTGCT GGCAGCGAAT 
GAACTGGGGA AAGATAAATT CGAAATCGTC ACGCCGAGTG AGTCTATCCT CGCAGAGCCA 
ACCGTGTCGG TGGTCGATAA AGTGGTCGAG AAAAAAGGCA CCAAAGAGGT GGCGGAAGCC 
TACCTGAAAT ATCTCTACTC GCCAGAAGGT CAGGAAATTG CCGCGAAAAA CTACTACCGT 
CCGCGCGACG CTGAGGTGGC GAAAAAGTAC GAAAATGCGT TTCCAAAGCT GAAGTTATTC 
ACCATTGATG AAGAGTTCGG CGGCTGGACG AAAGCGCAAA AAGAGCATTT TGCTAACGGC 
GGTACGTTCG ATCAGATCAG CAAACGCTGA

Protein sequence

MNKWGVGLTF LLAATSVMAK DIQLLNVSYD PTRELYEQYN KAFSAHWKQQ TGDNVVIRQS 
HGGSGKQATS VINGIEADVV TLALAYDVDA IAERGRIDKE WIKRLPDNSA PYTSTIVFLV 
RKGNPKQIHD WNDLIKPGVS VITPNPKSSG GARWNYLAAW GYALHHNNND QAKAQDFVRA 
LYKNVEVLDS GARGSTNTFV ERGIGDVLIA WENEALLAAN ELGKDKFEIV TPSESILAEP 
TVSVVDKVVE KKGTKEVAEA YLKYLYSPEG QEIAAKNYYR PRDAEVAKKY ENAFPKLKLF 
TIDEEFGGWT KAQKEHFANG GTFDQISKR