Gene EcHS_A2561 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2561
Symbol	cysP
ID	5593451
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2570076
End bp	2571092
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	55%
IMG OID	640921682
Product	thiosulfate transporter subunit
Protein accession	YP_001459209
Protein GI	157161891
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4150] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	80
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGTTA ACTTACTGAA AAAGAACTCA CTCGCGCTGG TCGCTTCTCT GCTGCTGGCG 
GGCCATGTAC AGGCAACGGA ACTGCTGAAC AGTTCTTATG ACGTCTCCCG CGAGCTGTTT 
GCCGCCCTGA ACCCGCCGTT TGAGCAACAA TGGGCCAAAG ATAACGGCGG TGACAAACTG 
ACGATAAAAC AATCTCATGC CGGGTCATCA AAACAGGCGC TGGCAATTTT GCAGGGCTTA 
AAAGCAGACG TTGTCACTTA TAACCAGGTG ACCGACGTAC AAATCCTGCA TGACAAAGGC 
AAGCTGATCC CGGCCGACTG GCAGTCGCGC CTGCCGAATA ACAGCTCGCC GTTCTACTCC 
ACCATGGGCT TCCTGGTGCG TAAGGGCAAC CCGAAGAATA TCCACGACTG GAACGACCTG 
GTGCGCTCCG ACGTGAAGCT GATTTTCCCA AACCCGAAAA CGTCGGGTAA CGCGCGTTAT 
ACCTATCTGG CGGCATGGGG CGCAGCGGAC AAAGCTGACG GTGGCGACAA AGCCAAAACC 
GAACAGTTTA TGACTCAGTT CCTGAAAAAC GTTGAAGTGT TCGATACCGG CGGTCGTGGC 
GCGACCACCA CCTTCGCCGA GCGCGGCCTG GGCGATGTGC TGATCAGCTT CGAGTCGGAA 
GTGAACAACA TCCGCAAACA GTATGAAGCG CAGGGCTTTG AAGTGGTGAT TCCGAAAACC 
AACATTCTGG CGGAATTCCC GGTGGCGTGG GTCGATAAAA ACGTGCAGGC CAACGGTACG 
GAAAAAGCCG CCAAAGCCTA CCTGAACTGG CTCTACAGCC CGCAGGCGCA AACCATCATC 
ACCGACTATT ACTACCGCGT GAATAACCCG GAAGTCATGG ACAAACTGAA AGATAAATTC 
CCGCAGACCG AGCTGTTCCG CGTGGAAGAC AAATTTGGCT CCTGGCCGGA AGTGATGAAA 
ACCCACTTCA CCAGCGGCGG CGAGTTAGAC AAGCTGTTAG CGGCGGGGCG TAATTAA

Protein sequence

MAVNLLKKNS LALVASLLLA GHVQATELLN SSYDVSRELF AALNPPFEQQ WAKDNGGDKL 
TIKQSHAGSS KQALAILQGL KADVVTYNQV TDVQILHDKG KLIPADWQSR LPNNSSPFYS 
TMGFLVRKGN PKNIHDWNDL VRSDVKLIFP NPKTSGNARY TYLAAWGAAD KADGGDKAKT 
EQFMTQFLKN VEVFDTGGRG ATTTFAERGL GDVLISFESE VNNIRKQYEA QGFEVVIPKT 
NILAEFPVAW VDKNVQANGT EKAAKAYLNW LYSPQAQTII TDYYYRVNNP EVMDKLKDKF 
PQTELFRVED KFGSWPEVMK THFTSGGELD KLLAAGRN