Gene EcolC_0767 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0767
Symbol
ID	6064899
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	819904
End bp	820854
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	53%
IMG OID	641600171
Product	glutathione synthetase
Protein accession	YP_001723766
Protein GI	170018812
COG category	[H] Coenzyme transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0189] Glutathione synthase/Ribosomal protein S6 modification enzyme (glutaminyl transferase)
TIGRFAM ID	[TIGR01380] glutathione synthetase, prokaryotic

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0268001
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000369912
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATCAAGC TCGGCATCGT GATGGACCCC ATCGCAAACA TCAACATCAA GAAAGATTCC 
AGTTTTGCTA TGTTGCTGGA AGCACAGCGT CGTGGTTACG AACTTCACTA TATGGAGATG 
GGCGATCTGT ATCTGATCAA TGGTGAAGCC CGCGCCCATA CCCGCACGCT GAACGTGAAG 
CAGAACTACG AAGAGTGGTT TTCGTTCGTC GGTGAACAGG ATCTGCCGCT GGCCGATCTC 
GATGTGATCC TGATGCGTAA AGACCCGCCG TTTGATACCG AGTTTATCTA CGCGACCTAT 
ATTCTGGAAC GTGCCGAAGA GAAAGGGACG CTGATCGTTA ACAAGCCGCA GAGCCTGCGC 
GACTGTAACG AGAAACTGTT TACCGCCTGG TTCTCTGACT TAACGCCAGA AACGCTGGTT 
ACGCGCAATA AAGCGCAGCT AAAAGCGTTC TGGGAGAAAC ACAGCGACAT CATTCTTAAG 
CCGCTGGACG GTATGGGCGG CGCGTCGATT TTCCGCGTGA AAGAAGGCGA TCCAAACCTC 
GGCGTGATTG CCGAAACCCT GACTGAGCAT GGCACTCGCT ACTGCATGGC GCAAAATTAC 
CTGCCAGCCA TTAAAGATGG CGACAAACGC GTGCTGGTGG TGGATGGCGA GCCGGTACCG 
TACTGCCTGG CGCGTATTCC GCAGGGGGGC GAAACCCGTG GCAATCTGGC TGCCGGTGGT 
CGCGGTGAAC CTCGTCCGCT GACGGAAAGT GACTGGAAAA TCGCCCGTCA GATCGGGCCG 
ACGCTGAAAG AAAAAGGGCT GATTTTTGTT GGTCTGGATA TCATCGGCGA CCGTCTGACT 
GAAATTAACG TCACCAGCCC AACCTGTATT CGTGAGATTG AAGCAGAGTT TCCGGTGTCG 
ATCACCGGAA TGTTAATGGA TGCCATCGAA GCACGTTTAC AGCAGCAGTA A

Protein sequence

MIKLGIVMDP IANINIKKDS SFAMLLEAQR RGYELHYMEM GDLYLINGEA RAHTRTLNVK 
QNYEEWFSFV GEQDLPLADL DVILMRKDPP FDTEFIYATY ILERAEEKGT LIVNKPQSLR 
DCNEKLFTAW FSDLTPETLV TRNKAQLKAF WEKHSDIILK PLDGMGGASI FRVKEGDPNL 
GVIAETLTEH GTRYCMAQNY LPAIKDGDKR VLVVDGEPVP YCLARIPQGG ETRGNLAAGG 
RGEPRPLTES DWKIARQIGP TLKEKGLIFV GLDIIGDRLT EINVTSPTCI REIEAEFPVS 
ITGMLMDAIE ARLQQQ