Gene EcolC_4101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4101
Symbol
ID	6065790
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4525477
End bp	4526466
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	50%
IMG OID	641603523
Product	sulfate transporter subunit
Protein accession	YP_001727026
Protein GI	170022072
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAGT GGGGCGTAGG GTTAACATTT TTGCTGGCGG CAACCAGCGT TATGGCAAAG 
GATATTCAGC TTCTTAACGT TTCATATGAT CCAACGCGCG AATTGTACGA ACAGTACAAC 
AAGGCATTCA GCGCCCACTG GAAACAGCAA ACTGGTGATA ACGTGGTGAT TCGTCAGTCA 
CACGGTGGCT CAGGTAAACA AGCGACGTCG GTAATCAACG GTATTGAAGC TGATGTTGTC 
ACGCTGGCTC TGGCCTATGA CGTGGACGCA ATTGCGGAAC GCGGGCGGAT TGATAAAGAG 
TGGATCAAAC GTCTGCCGGA TAACTCCGCA CCGTACACTT CCACCATTGT TTTCCTGGTA 
CGTAAGGGAA ATCCGAAGCA GATCCATGAC TGGAACGATC TGATTAAACC GGGTGTTTCG 
GTGATCACGC CTAATCCGAA AAGCTCTGGT GGCGCGCGCT GGAATTACTT GGCAGCCTGG 
GGCTACGCGC TGCATCACAA CAACAACGAT CAGGCAAAAG CACAGGATTT TGTTCGGGCA 
CTGTATAAAA ACGTCGAAGT TCTGGATTCT GGCGCGCGCG GCTCCACTAA CACTTTTGTC 
GAGCGCGGAA TTGGCGATGT ACTGATTGCC TGGGAAAACG AAGCTCTGTT GGCAGCGAAT 
GAACTGGGGA AAGATAAATT CGAAATCGTC ACGCCGAGTG AGTCTATCCT CGCGGAACCA 
ACCGTGTCGG TGGTCGATAA AGTGGTCGAG AAAAAAGGTA CTAAAGAGGT GGCGGAAGCC 
TACCTGAAAT ATCTCTACTC GCCAGAAGGT CAGGAAATTG CCGCGAAAAA CTACTACCGT 
CCGCGCGACG CTGAGGTGGC GAAAAAGTAC GAAAATGCGT TTCCAAAGCT GAAGTTATTC 
ACCATTGATG AAGAGTTCGG CGGCTGGACG AAAGCGCAAA AAGAGCATTT TGCTAACGGC 
GGTACGTTCG ATCAGATCAG CAAACGCTGA

Protein sequence

MNKWGVGLTF LLAATSVMAK DIQLLNVSYD PTRELYEQYN KAFSAHWKQQ TGDNVVIRQS 
HGGSGKQATS VINGIEADVV TLALAYDVDA IAERGRIDKE WIKRLPDNSA PYTSTIVFLV 
RKGNPKQIHD WNDLIKPGVS VITPNPKSSG GARWNYLAAW GYALHHNNND QAKAQDFVRA 
LYKNVEVLDS GARGSTNTFV ERGIGDVLIA WENEALLAAN ELGKDKFEIV TPSESILAEP 
TVSVVDKVVE KKGTKEVAEA YLKYLYSPEG QEIAAKNYYR PRDAEVAKKY ENAFPKLKLF 
TIDEEFGGWT KAQKEHFANG GTFDQISKR