Gene ECH74115_2287 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2287
Symbol
ID	6970575
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	2158749
End bp	2160131
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	49%
IMG OID	643386166
Product	exonuclease family protein
Protein accession	YP_002270650
Protein GI	209397980
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.118532
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00000000000465845
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGAAACGG CAATTCCAGA CAACGAAAAA ACCGAATGCA AAGTGGAAGT CGAACCATCT 
GTAGAACGTG AGGGGCCGTT CTACTTCCTC TTCACCGACA AGGATGGCGA AAAATACGGT 
CGCGCAAACA AACTTTCTGG TCTGGATAAG GCGCTGGCTG CCGGGGCTAC TGAAATCACA 
AAAGAAGAAT ATTTTGCCCG AAAAAATGGC ACATACACAG GCTTACCGCA AAATGCAAAT 
ACCGCACAAA ATTCTGAACA ACCAGAACCG GTAAAAGTTA CCGCTGACGA AGTAAAGAAA 
ATTATGCAGG CAGCCAATAT CAGCCAGCCT GACGCCGAGG AACTGCTTGC AGTATCACGT 
GGTGAATTTG TTGAAGGGAT TAGCGACCCG AATGATCCGA AATGGGTTAA GGGGATCCAG 
ACCCGCGATT CTGTGAACCA GAACCAGCAA GAAACGGAAC AGAACGACCA GAAAGCGGAA 
CAAAACAGCC CAAATACGCA ACAAAACGAG CCAGAAACGA AACAACCTGA ACCAGTAGTG 
CAACAGGAAC CGGAAAAGAT CTGCACCGCC TGCGGTCAGA GCGGTGGCGG CAACTGCCCT 
GATTGTGGTG CGGTGATGGG TGACGCAACA TACCAGGAAA TATTCGATGG AGAGAATCAG 
CCTGAAGTTC AGGAAAATGA TCCGGAGGAA ATGGAAGGTA CTGCACATCA GCACAAGGAG 
AACACTGGCG GCAATCAGCA TCATGCCAGC GATAGTGAAA CTGGCGAGGC GTCAGATCCC 
TTAATTAAGG CGAACGGTCA TCATAATCTC ACATCCACCA GCAGAGCGGG GATTCATCTG 
ATGATCGATC TTGAAACCAT GGGAAAAAAT CCCGATGCCC CGATTATCTC AATAGGTGCA 
ATATTTTTCG ATCCGCAAAC CGGAGATATG GGACCGGAAT TTAGTAAGAC TATCGATCTG 
GATACTGCTG GCGGAGTCAT TGATCGGGAC ACCATGAAAT GGTGGCTTAA ACAATCACGC 
GAAGCGCAAT CTGCCATTAT GACCGATGAA ATCCCGTTAG ATGATGCACT GTTACAATTG 
CGGGAATTTA TCGACGAAAA CTCCGGTGAA TTTTTTGTTC ATGTCTGGGG AAATGGAGCC 
AACTTCGACA ACACGATTTT GCGCCGTTCA TACGAACGGC AGGGGAGCCC CTGCCCGTGG 
CGTTACTACA ACGATCGCGA TGTACGCACA ATCGTTGAGC TGGGGAAAGC CATAGACTTC 
GATGCCAGAA CGGCTATTCC ATTCGAAGGT GAGCGCCATA ATGCACTTGA TGACGCCCGT 
TACCAGGCAA AATACGTTTC AGCTATCTGG CAAAAACTGA TCCCGAGTCA GGCTGATTCT 
TAA

Protein sequence

METAIPDNEK TECKVEVEPS VEREGPFYFL FTDKDGEKYG RANKLSGLDK ALAAGATEIT 
KEEYFARKNG TYTGLPQNAN TAQNSEQPEP VKVTADEVKK IMQAANISQP DAEELLAVSR 
GEFVEGISDP NDPKWVKGIQ TRDSVNQNQQ ETEQNDQKAE QNSPNTQQNE PETKQPEPVV 
QQEPEKICTA CGQSGGGNCP DCGAVMGDAT YQEIFDGENQ PEVQENDPEE MEGTAHQHKE 
NTGGNQHHAS DSETGEASDP LIKANGHHNL TSTSRAGIHL MIDLETMGKN PDAPIISIGA 
IFFDPQTGDM GPEFSKTIDL DTAGGVIDRD TMKWWLKQSR EAQSAIMTDE IPLDDALLQL 
REFIDENSGE FFVHVWGNGA NFDNTILRRS YERQGSPCPW RYYNDRDVRT IVELGKAIDF 
DARTAIPFEG ERHNALDDAR YQAKYVSAIW QKLIPSQADS