Gene ECH74115_1123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1123
Symbol
ID	6970627
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	1154556
End bp	1156718
Gene Length	2163 bp
Protein Length	720 aa
Translation table	11
GC content	52%
IMG OID	643385129
Product	hypothetical protein
Protein accession	YP_002269628
Protein GI	209398790
COG category	[S] Function unknown
COG ID	[COG1289] Predicted membrane protein
TIGRFAM ID	[TIGR01435] glutamate--cysteine ligase/gamma-glutamylcysteine synthetase, Streptococcus agalactiae type [TIGR01666] hypothetical membrane protein, TIGR01666 [TIGR01667] integral membrane protein, YccS/YhfK family

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00725319
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.391034
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCTTTA TGCTAAGTCC TTTGCTCAAA CGCTATACCT GGAACAGCGC CTGGCTGTAT 
TACGCGCGTA TTTTTATTGC GCTTTGTGGA ACCACAGCGT TTCCGTGGTG GCTGGGTGAT 
GTAAAACTGA CGATTCCGCT AACGCTGGGG ATGGTGGCAG CGGCGCTGAC CGATCTCGAT 
GACCGACTGG CGGGACGTTT GCGTAACCTC ATCATTACGC TGTTCTGCTT TTTTATCGCC 
TCGGCCTCAG TAGAATTGCT GTTTCCCTGG CCCTGGCTAT TTGCGATTGG CTTAACGCTC 
TCTACCAGCG GCTTCATTTT GCTCGGCGGT CTGGGTCAAC GCTATGCAAC AATTGCCTTC 
GGTGCATTGC TGATCGCCAT TTACACTATG TTGGGAACAT CACTGTATGA GCACTGGTAT 
CAGCAGCCGA TGTATCTGCT GGCCGGTGCC GTCTGGTACA ACGTCCTGAC ACTTATTGGT 
CATCTGCTGT TCCCGGTCCG CCCGCTGCAG GACAACCTGG CGCGTTGCTA TGAACAACTG 
GCGCGTTATC TTGAGCTCAA GTCGCGCATG TTTGATCCTG ATATTGAAGA TGAAAGCCAG 
GCACCGCTGT ACGATTTGGC TCTCGCCAAC GGTCTGCTGA TGGCGACATT GAATCAGACG 
AAACTCTCGC TGCTGACCCG CTTACGTGGC GATCGTGGTC AACGGGGAAC GCGTCGCACG 
CTGCATTATT ACTTTGTCGC ACAGGATATT CACGAGCGTG CCAGCTCTTC TCATATTCAG 
TATCAAACAT TGCGTGAACA TTTTCGCCAC AGCGACGTGC TGTTCCGTTT TCAGCGGCTG 
ATGTCGATGC AGGGCCAGGC GTGCCAGCAA CTGTCACGCT GTATTTTGTT GCGTCAGCCT 
TATCAACATG ATCCGCATTT TGAGCGCGCT TTTACGCATA TTGATGCTGC GCTGGAGCGG 
ATGCGCGATA ACGGCGCACC CGCCGATTTA CTCAAAACAC TGGGATTTTT GCTGAACAAT 
TTACGCGCCA TTGATGCCCA ACTGGCAACA ATTGAATCAG AACAGGCCCA GGCACTACCC 
CATAATAATG ACGAAAATGA GCTCGCTGAT GACAGCCCGC ACGGGTTGAG TGATATCTGG 
CTGCGTCTTA GCCGTCACTT CACGCCGGAA TCCGCCCTCT TCCGTCATGC GGTAAGAATG 
TCGCTGGTGT TGTGCTTCGG CTACGCCATC ATTCAGATAA CCGGAATGCA TCACGGGTAT 
TGGATCTTGC TGACAAGTTT GTTTGTCTGC CAGCCAAACT ATAACGCCAC GCGCCACCGC 
CTGAAGTTAA GGATTATTGG TACGCTGGTA GGTATCGCCA TTGGCATTCC TGTGCTGTGG 
TTTGTGCCAT CACTGGAAGG GCAGCTGGTG CTGCTGGTTA TTACCGGCGT GCTCTTTTTT 
GCCTTCCGTA ACGTGCAATA CGCTCATGCA ACGATGTTCA TCACACTTTT GGTGCTACTG 
TGTTTTAACT TACTGGGTGA AGGTTTTGAA GTAGCGTTAC CTCGCGTAAT CGATACGCTG 
ATTGGTTGTG CCATTGCGTG GGCGGCAGTG AGCTACATCT GGCCTGACTG GCAGTTTCGC 
AATCTGCCGC GCATGCTCGA ACGCGCCACA GAGGCCAACT GTCGGTATCT CGATGCCATA 
CTGGAGCAAT ACCATCAGGG GCGTGATAAC CGTCTGGCGT ATCGTATTGC CCGCCGCGAT 
GCACACAACC GTGATGCTGA GCTGGCGTCG GTGGTATCAA ATATGTCCAG CGAGCCGAAC 
GTTACCCCGC AAATTCGCGA AGCCGCGTTT CGGTTGCTGT GCCTTAACCA TACGTTTACC 
AGCTATATCT CAGCCCTCGG TGCTCACCGG GAGCAGTTAA CTAATCCTGA AATTCTGGCG 
TTTCTTGATG ACGCAGTTTG CTATGTTGAT GACGCGTTAC ATCATCAACC TGCTGATGAA 
GAACGCGTCA ATGAGGCATT AGCTAGCCTG AAACAGCGGA TGCAGCAACT TGAACCACGG 
GCAGACAGCA AAGAACCTCT GGTCGTACAA CAAGTTGGAC TATTGATTGC ATTACTGCCT 
GAGATTGGTC GTCTGCAACG CCAGATTACT CAAGTTCCGC AGGAAACTCC TGTTTCGGCG 
TAA

Protein sequence

MAFMLSPLLK RYTWNSAWLY YARIFIALCG TTAFPWWLGD VKLTIPLTLG MVAAALTDLD 
DRLAGRLRNL IITLFCFFIA SASVELLFPW PWLFAIGLTL STSGFILLGG LGQRYATIAF 
GALLIAIYTM LGTSLYEHWY QQPMYLLAGA VWYNVLTLIG HLLFPVRPLQ DNLARCYEQL 
ARYLELKSRM FDPDIEDESQ APLYDLALAN GLLMATLNQT KLSLLTRLRG DRGQRGTRRT 
LHYYFVAQDI HERASSSHIQ YQTLREHFRH SDVLFRFQRL MSMQGQACQQ LSRCILLRQP 
YQHDPHFERA FTHIDAALER MRDNGAPADL LKTLGFLLNN LRAIDAQLAT IESEQAQALP 
HNNDENELAD DSPHGLSDIW LRLSRHFTPE SALFRHAVRM SLVLCFGYAI IQITGMHHGY 
WILLTSLFVC QPNYNATRHR LKLRIIGTLV GIAIGIPVLW FVPSLEGQLV LLVITGVLFF 
AFRNVQYAHA TMFITLLVLL CFNLLGEGFE VALPRVIDTL IGCAIAWAAV SYIWPDWQFR 
NLPRMLERAT EANCRYLDAI LEQYHQGRDN RLAYRIARRD AHNRDAELAS VVSNMSSEPN 
VTPQIREAAF RLLCLNHTFT SYISALGAHR EQLTNPEILA FLDDAVCYVD DALHHQPADE 
ERVNEALASL KQRMQQLEPR ADSKEPLVVQ QVGLLIALLP EIGRLQRQIT QVPQETPVSA