Gene ECH74115_3734 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3734
Symbol	xseA
ID	6968275
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3454491
End bp	3455861
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	54%
IMG OID	643387526
Product	exodeoxyribonuclease VII large subunit
Protein accession	YP_002271979
Protein GI	209400584
COG category	[L] Replication, recombination and repair
COG ID	[COG1570] Exonuclease VII, large subunit
TIGRFAM ID	[TIGR00237] exodeoxyribonuclease VII, large subunit

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000326312
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTACCTT CTCAATCCCC TGCAATTTTT ACCGTTAGTC GCCTGAATCA AACGGTTCGT 
CTGCTGCTTG AGCATGAGAT GGGACAGGTT TGGATCAGCG GCGAAATCTC TAATTTCACA 
CAACCGGCTT CCGGTCACTG GTACTTTACA CTCAAAGACG ACACCGCCCA GGTACGCTGC 
GCGATGTTCC GCAACAGCAA CCGCCGGGTG ACCTTCCGCC CACAGCATGG GCAACAAGTT 
TTAGTTCGCG CCAATATTAC GCTCTACGAG CCGCGCGGCG ACTACCAGAT AATCGTTGAG 
AGTATGCAGC CGGCCGGTGA AGGGCTGCTG CAACAGAAGT ACGAACAGCT CAAAGCGAAG 
TTGCAGGCTG AAGGATTGTT CGATCTGCAA TACAAAAAAC CACTTCCCTC CCCTGCGCAT 
TGCGTTGGTG TGATCACCTC AAAAACCGGT GCTGCGCTAC ATGATATTTT GCATGTGTTA 
AAACGTCGCG ATCCTTCTCT GCCGGTGATC ATCTACCCCA CCGCCGTTCA GGGCGATGAC 
GCGCCGGGGC AAATTGTTCG CGCCATTGAA CTGGCGAATC AGTGCAATGA GTGCGACGTG 
TTGATCGTTG GGCGCGGCGG CGGTTCGCTG GAAGATTTAT GGAGTTTTAA CGACGAACGC 
GTAGCGCGGG CGATTTTTGC CAGCCGCATT CCGGTCGTCA GCGCCGTCGG GCATGAGACG 
GATGTGACCA TTGCCGATTT TGTTGCCGAT CTGCGTGCAC CAACACCGTC GGCTGCCGCC 
GAAGTGGTGA GCCGTAATCA GCAAGAGTTA CTGCGCCAGG TGCAATCGAC CCGTCAACGG 
CTGGAGATGG CGATGGATTA TTATCTCGCC AACCGCACAC GTCGCTTTAC GCAAATTCAT 
CACCGATTAC AGCAACAGCA TCCGCAGCTC CGGCTGGCAC GCCAGCAAAC CATGCTTGAA 
CGCCTGCAAA AACGGATGAG CTTTGCGCTG GAAAATCAAC TTAAGCGTGC CGGGCAACAG 
CAGCAGCGAT TAACACAGCG GCTGAATCAG CAAAATCCAC AGCCGAAGAT TCATCGCGCG 
CAAACGCGCA TTCAGCAACT GGAATATCGT TTAGCAGAAA CCCTGCGCGC ACAGCTTAGC 
GCCACGCGTG AACGTTTCGG TAATGCAGTA ACGCACCTCG AAGCCGTAAG CCCACTGTCA 
ACGCTGGCGC GTGGATACAG CGTTACTACT GCTACTGACG GCAAGGTACT GAAAAAAGTG 
AAGCAGGTTA AAGCGGGTGA AATGCTAACC ACACGTCTGG AAGACGGCTG GGTAGAAAGT 
GAAGTAAAAA ACATCCAGCC GGTAAAAAAA TCGCGTAAAA AAGTGCATTA A

Protein sequence

MLPSQSPAIF TVSRLNQTVR LLLEHEMGQV WISGEISNFT QPASGHWYFT LKDDTAQVRC 
AMFRNSNRRV TFRPQHGQQV LVRANITLYE PRGDYQIIVE SMQPAGEGLL QQKYEQLKAK 
LQAEGLFDLQ YKKPLPSPAH CVGVITSKTG AALHDILHVL KRRDPSLPVI IYPTAVQGDD 
APGQIVRAIE LANQCNECDV LIVGRGGGSL EDLWSFNDER VARAIFASRI PVVSAVGHET 
DVTIADFVAD LRAPTPSAAA EVVSRNQQEL LRQVQSTRQR LEMAMDYYLA NRTRRFTQIH 
HRLQQQHPQL RLARQQTMLE RLQKRMSFAL ENQLKRAGQQ QQRLTQRLNQ QNPQPKIHRA 
QTRIQQLEYR LAETLRAQLS ATRERFGNAV THLEAVSPLS TLARGYSVTT ATDGKVLKKV 
KQVKAGEMLT TRLEDGWVES EVKNIQPVKK SRKKVH