Gene EcHS_A3290 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3290
Symbol
ID	5591821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3299937
End bp	3300923
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	51%
IMG OID	640922408
Product	hypothetical protein
Protein accession	YP_001459902
Protein GI	157162584
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0435] Predicted glutathione S-transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTCAAC TGATTGACGG CGTCTGGCAT GACACCTGGT ACGATACCAA ATCTACCGGC 
GGTAAATTTC AACGTTCAGC TTCCGCATTT CGTAACTGGC TCACTGCCGA TGGCGCTCCT 
GGCCCCACTG GCACAGGCGG TTTTATCGCA GAGAAAGATC GTTATCATCT CTATGTTTCA 
CTCGCCTGCC CGTGGGCGCA CCGCACGCTG ATCATGCGCA AACTCAAAGG ACTGGAACCG 
TTTATTTCCG TTTCCGTAGT GAACCCGCTG ATGCTGGAAA ACGGCTGGAC CTTTGATGAC 
AGTTTTCCGG GAGCAACCGG AGACACGCTC TATCAACATG AATTTTTGTA TCAGCTTTAT 
CTCCGCGCCG ATCCCCACTA CAGCGGACGA GTTACTGTTC CCGTGCTGTG GGACAAAAAG 
AACCACACCA TCGTCAGCAA CGAATCAGCA GAAATCATCC GCATGTTTAA TACCGCGTTT 
GATGCGCTGG GCGCGAAAGC GGGTGATTAC TACCCACCAG CCCTGCAAAC GAAAATTGAC 
GAACTTAACG GCTGGATTTA TGACACCGTT AACAACGGCG TGTATAAAGC TGGTTTTGCC 
ACCAGCCAGC AAGCCTACGA CGAAGCGGTG GAGAAAGTGT TTGAATCGCT GGCGCGACTG 
GAACAGATTT TAGGTCAGCA TCGTTACCTG ACCGGCAACC AGCTAACCGA AGCCGATATT 
CGCCTGTGGA CCACGCTGGT CCGTTTTGAT CCAGTGTATG TGACCCACTT CAAGTGTGAT 
AAGCACCGCA TCAGCGATTA CCTTAATCTG TATGGCTTCC TGCGCGATAT CTACCAGATG 
CCGGGAATTG CCGAAACAGT CAATTTCGAT CACATCCGTA ATCATTACTT CCGCAGCCAT 
AAGACCATCA ACCCTACGGG GATTATTTCA ATTGGTCCGT GGCAGGATCT CGATGAACCG 
CATGGACGAG ATGTTCGCTT CGGTTAA

Protein sequence

MGQLIDGVWH DTWYDTKSTG GKFQRSASAF RNWLTADGAP GPTGTGGFIA EKDRYHLYVS 
LACPWAHRTL IMRKLKGLEP FISVSVVNPL MLENGWTFDD SFPGATGDTL YQHEFLYQLY 
LRADPHYSGR VTVPVLWDKK NHTIVSNESA EIIRMFNTAF DALGAKAGDY YPPALQTKID 
ELNGWIYDTV NNGVYKAGFA TSQQAYDEAV EKVFESLARL EQILGQHRYL TGNQLTEADI 
RLWTTLVRFD PVYVTHFKCD KHRISDYLNL YGFLRDIYQM PGIAETVNFD HIRNHYFRSH 
KTINPTGIIS IGPWQDLDEP HGRDVRFG