Gene ECH74115_3934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3934
Symbol	gshA
ID	6972324
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3643277
End bp	3644833
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	52%
IMG OID	643387707
Product	glutamate--cysteine ligase
Protein accession	YP_002272155
Protein GI	209397887
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2918] Gamma-glutamylcysteine synthetase
TIGRFAM ID	[TIGR01434] glutamate--cysteine ligase [TIGR01435] glutamate--cysteine ligase/gamma-glutamylcysteine synthetase, Streptococcus agalactiae type

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.161519
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.776675
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGATCCCGG ACGTATCACA GGCGCTGGCC TGGCTGGAAA AACATCCTCA GGCGTTAAAG 
GGGATACAGC GTGGGCTGGA GCGCGAAACT TTGCGTGTTA ATGCTGATGG CACACTGGCA 
ACAACAGGTC ATCCTGAAGC ATTAGGTTCC GCACTGACGC ATAAATGGAT TACTACCGAT 
TTTGCGGAAG CATTGCTGGA ATTCATTACA CCAGTGGATG GTGATATTGA ACATATGCTG 
ACCTTTATGC GCGATCTGCA TCGTTATACG GCGCGCAATA TGGGCGATGA GCGGATGTGG 
CCGTTAAGTA TGCCATGCTA CATCGCAGAA GGTCAGGACA TCGAACTGGC GCAGTACGGC 
ACTTCTAACA CCGGACGCTT TAAAACGCTG TACCGTGAAG GGCTGAAAAA TCGCTACGGC 
GCGCTGATGC AAACCATCTC CGGCGTGCAT TACAACTTCT CTTTGCCTAT GGCATTCTGG 
CAAGCGAAGT GTGGCGATAT TTCGGGCGCT GATGCTAAAG AGAAAATCTC TGCGGGCTAT 
TTCCGCGTTA TTCGCAACTA CTATCGCTTC GGTTGGGTCA TTCCTTATCT GTTTGGCGCG 
TCTCCGGCAA TATGCTCTTC ATTCCTGCAA GGTAAACCAA CGTCGCTGCC GTTTGAGAAA 
ACCGAGTGCG GTATGTATTA CCTGCCGTAT GCGACCTCTC TTCGTTTGAG CGATCTCGGC 
TATACCAATA AATCGCAAAG CAATCTTGGT ATTACCTTCA ACGATCTTTA CGAGTACGTA 
GCGGGCCTGA AACAGGCAAT CAAAACGCCA TCGGAAGAGT ACGCGAAGAT TGGTATTGAT 
AAAGACGGTA AGAGGCTGCA AATCAACAGC AACGTGCTGC AGATTGAAAA CGAACTGTAC 
GCGCCGATTC GTCCAAAACG CGTTACCCGC AGCGGCGAGT CGCCTTCTGA TGCGCTGTTA 
CGTGGCGGCA TTGAATATAT TGAAGTGCGT TCGCTGGACA TCAACCCGTT CTCGCCGATT 
GGTGTAGATG AACAGCAGGT GCGATTCCTC GACCTGTTTA TGGTCTGGTG TGCGCTGGCT 
GATGCACCGG AAATGAGCAG TAGCGAACTT GCCTGTACAC GCGTTAACTG GAACCGGGTG 
ATCCTCGAAG GTCGCAAACC GGGTCTGACG CTGGGTATCG GCTGCGAAAC CGCACAGTTC 
CCGTTACCGC AGGTGGGTAA AGATCTGTTC CGCGATCTGA AACGCGTCGC GCAAACGCTG 
GATAGCATTA ACGGCGGCGA AGCGTATCAG AAAGTGTGTG ATGAACTGGT TGCCTGCTTC 
GATAATCCCG ATCTGACTTT CTCTGCCCGT ATCTTAAGGT CTATGATTGA TACTGGTATT 
GGCGGAACAG GCAAAGCGTT TGCTGAAGCG TACCGTAATC TGCTGCGTGA AGAGCCGCTG 
GAAATTCTGC GCGAAGAGGA TTTTGTAGCC GAGCGCGAGG CATCTGAACG CCGTCAGCAG 
GAAATGGAAG CCGCAGATAC CGAACCGTTT GCGGTGTGGC TGGAAAAACA CGCCTGA

Protein sequence

MIPDVSQALA WLEKHPQALK GIQRGLERET LRVNADGTLA TTGHPEALGS ALTHKWITTD 
FAEALLEFIT PVDGDIEHML TFMRDLHRYT ARNMGDERMW PLSMPCYIAE GQDIELAQYG 
TSNTGRFKTL YREGLKNRYG ALMQTISGVH YNFSLPMAFW QAKCGDISGA DAKEKISAGY 
FRVIRNYYRF GWVIPYLFGA SPAICSSFLQ GKPTSLPFEK TECGMYYLPY ATSLRLSDLG 
YTNKSQSNLG ITFNDLYEYV AGLKQAIKTP SEEYAKIGID KDGKRLQINS NVLQIENELY 
APIRPKRVTR SGESPSDALL RGGIEYIEVR SLDINPFSPI GVDEQQVRFL DLFMVWCALA 
DAPEMSSSEL ACTRVNWNRV ILEGRKPGLT LGIGCETAQF PLPQVGKDLF RDLKRVAQTL 
DSINGGEAYQ KVCDELVACF DNPDLTFSAR ILRSMIDTGI GGTGKAFAEA YRNLLREEPL 
EILREEDFVA EREASERRQQ EMEAADTEPF AVWLEKHA