Gene EcolC_1168 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1168
Symbol	xseA
ID	6066491
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1277147
End bp	1278517
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	53%
IMG OID	641600584
Product	exodeoxyribonuclease VII large subunit
Protein accession	YP_001724162
Protein GI	170019208
COG category	[L] Replication, recombination and repair
COG ID	[COG1570] Exonuclease VII, large subunit
TIGRFAM ID	[TIGR00237] exodeoxyribonuclease VII, large subunit

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000633307
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0126087
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTACCTT CTCAATCCCC TGCAATTTTT ACCGTTAGTC GCCTGAATCA AACGGTTCGT 
CTGCTGCTTG AGCATGAGAT GGGACAGGTT TGGATCAGCG GCGAAATCTC TAATTTCACA 
CAACCGGCTT CCGGTCACTG GTACTTTACA CTCAAAGACG ACACCGCCCA GGTACGCTGC 
GCGATGTTCC GCAACAGCAA CCGCCGGGTG ACCTTCCGCC CACAGCATGG GCAACAAGTT 
TTAGTTCGCG CCAATATTAC GCTCTACGAG CCGCGCGGCG ACTACCAGAT AATCGTTGAG 
AGTATGCAGC CGGCCGGTGA AGGGCTGCTG CAACAGAAGT ACGAACAGCT CAAAGCGAAG 
TTGCAGGCTG AAGGTTTGTT CGATCAGCAA TACAAAAAAC CACTTCCCTC CCCTGCGCAT 
TGCGTTGGTG TGATCACCTC AAAAACCGGT GCTGCGCTAC ATGATATTTT GCATGTGTTA 
AAACGTCGCG ATCCTTCTCT ACCGGTGATC ATCTACCCCA CCGCCGTTCA GGGCGATGAC 
GCGCCGGGGC AAATTGTTCG CGCCATTGAA CTGGCGAATC AGCGCAATGA GTGCGACGTG 
TTGATCGTTG GGCGCGGCGG CGGTTCGCTG GAAGATTTAT GGAGTTTTAA CGACGAACGC 
GTAGCGCGGG CTATTTTTGC CAGCCGCATT CCGGTCGTCA GCGCCGTCGG GCATGAGACG 
GATGTGACCA TTGCCGATTT TGTTGCCGAT CTGCGTGCGC CAACGCCGTC TGCCGCCGCT 
GAAGTAGTAA GCCGTAATCA GCAAGAGTTA CTGCGCCAGG TGCAATCGGC CCGTCAACGG 
CTGGAGATGG CGATGGATTA TTATCTCGCC AACCGTACGC GTCGCTTTAC GCAGATTCAT 
CATCGCTTGC AGCAGCAGCA TCCGCAGCTC CGGCTGGCAC GCCAGCAAAC CATGCTTGAA 
CGCCTGAAAA AACGGATGAG CTTTGCGCTG GAAAATCAGC TTAAGCGTGC CGGGCAACAG 
CAGCAGCGAT TAACACAGCG GCTGAATCAG CAAAATCCAC AGCCGAAGAT TCATCGCGCG 
CAAACGCGCA TTCAGCAACT GGAATATCGT TTAGCAGAAA TCCTGCGCGC ACAGCTTAGC 
GCCACGCGTG AACGTTTCGG TAATGCAGTA ACGCACCTCG AAGCCGTAAG CCCACTGTCA 
ACGCTGGCGC GTGGATACAG CGTTACTACT GCTACTGACG GCAATGTACT GAAAAAAGTG 
AAGCAAGTTA AAGCGGGTGA AATGCTAACC ACACGTCTGG AAGACGGCTG GATAGAAAGT 
GAAGTAAAAA ACATCCAGCC GGTAAAAAAA TCGCGTAAAA AGGTTCATTA A

Protein sequence

MLPSQSPAIF TVSRLNQTVR LLLEHEMGQV WISGEISNFT QPASGHWYFT LKDDTAQVRC 
AMFRNSNRRV TFRPQHGQQV LVRANITLYE PRGDYQIIVE SMQPAGEGLL QQKYEQLKAK 
LQAEGLFDQQ YKKPLPSPAH CVGVITSKTG AALHDILHVL KRRDPSLPVI IYPTAVQGDD 
APGQIVRAIE LANQRNECDV LIVGRGGGSL EDLWSFNDER VARAIFASRI PVVSAVGHET 
DVTIADFVAD LRAPTPSAAA EVVSRNQQEL LRQVQSARQR LEMAMDYYLA NRTRRFTQIH 
HRLQQQHPQL RLARQQTMLE RLKKRMSFAL ENQLKRAGQQ QQRLTQRLNQ QNPQPKIHRA 
QTRIQQLEYR LAEILRAQLS ATRERFGNAV THLEAVSPLS TLARGYSVTT ATDGNVLKKV 
KQVKAGEMLT TRLEDGWIES EVKNIQPVKK SRKKVH