Gene EcolC_1726 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1726
Symbol	uvrC
ID	6067201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1921985
End bp	1923817
Gene Length	1833 bp
Protein Length	610 aa
Translation table	11
GC content	52%
IMG OID	641601138
Product	excinuclease ABC subunit C
Protein accession	YP_001724703
Protein GI	170019749
COG category	[L] Replication, recombination and repair
COG ID	[COG0322] Nuclease subunit of the excinuclease complex
TIGRFAM ID	[TIGR00194] excinuclease ABC, C subunit

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000100265
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTGATC AGTTTGACGC AAAAGCGTTT TTAAAAACCG TAACCAGCCA GCCAGGCGTT 
TATCGCATGT ACGATGCTGG TGGTACGGTT ATCTATGTCG GCAAAGCGAA AGACCTGAAA 
AAACGGCTTT CCAGCTATTT CCGTAGCAAC CTCGCTTCGC GCAAAACCGA AGCGCTGGTC 
GCCCAGATCC AGCAAATTGA TGTAACGGTT ACTCATACAG AAACCGAAGC GCTGTTGCTG 
GAACACAACT ACATCAAACT CTATCAGCCG CGTTACAACG TTTTACTACG CGATGATAAA 
TCTTATCCCT TTATCTTCCT GAGTGGCGAT ACCCATCCGC GTCTGGCGAT GCATCGTGGT 
GCGAAGCATG CTAAAGGTGA ATATTTCGGC CCGTTCCCGA ATGGCTATGC CGTACGTGAA 
ACACTGGCGC TACTGCAAAA GATTTTCCCC ATTCGCCAGT GCGAAAACAG TGTTTATCGC 
AATCGCTCGC GTCCGTGTCT GCAATATCAG ATAGGACGTT GTCTGGGGCC GTGCGTTGAA 
GGACTGGTGA GTGAAGAAGA ATACGCTCAG CAGGTCGAGT ATGTGCGCCT GTTTTTGTCT 
GGCAAAGATG ATCAGGTGCT TACGCAACTG ATTAGCCGTA TGGAAACTGC CAGCCAGAAT 
CTGGAGTTTG AAGAAGCTGC ACGTATTCGC GACCAAATTC AGGCGGTGCG ACGCGTCACC 
GAAAAACAGT TTGTTTCCAA TACCGGCGAC GACCTTGACG TTATTGGTGT GGCGTTCGAT 
GCGGGCATGG CTTGTGTCCA CGTATTGTTC ATTCGTCAGG GCAAAGTGCT CGGCAGCCGC 
AGCTATTTCC CGAAAGTGCC TGGCGGTACG GAACTGAGCG AGGTGGTGGA AACCTTCGTA 
GGTCAGTTCT ATTTACAAGG CAGCCAGATG CGCACCTTAC CGGGTGAGAT CCTGCTCGAT 
TTTAATCTTA GCGATAAAAC GCTGCTCGCC GATTCCCTTT CAGAACTGGC GGGACGCAAG 
ATTAATGTTC AAACCAAACC TCGCGGCGAT AGGGCGCGTT ATCTGAAACT CGCGCGCACC 
AATGCGGCGA CGGCCTTAAC CAGCAAACTT TCGCAGCAAT CTACCGTTCA CCAGCGGCTT 
ACAGCACTTG CCAGTGTGTT GAAATTGCCG GAAGTGAAGC GGATGGAGTG CTTTGACATC 
AGCCATACCA TGGGTGAACA AACCGTCGCT TCCTGTGTGG TGTTTGATGC TAACGGCCCG 
CTGCGTGCGG AGTATCGGCG CTATAACATT ACTGGCATCA CGCCGGGCGA TGATTATGCG 
GCGATGAATC AGGTGCTGCG TCGGCGTTAT GGTAAAGCCA TCGACGACAG TAAGATCCCG 
GATGTGATAC TTATCGACGG CGGCAAAGGC CAGCTTGCGC AGGCGAAAAA TGTCTTCGCC 
GAACTGGATG TCTCATGGGA TAAAAATCAT CCGCTGCTAC TTGGCGTTGC CAAAGGAGTA 
GATCGTAAGG CTGGGCTGGA AACGCTGTTC TTTGAGCCGG AAGGTGAGGG ATTCAGTTTG 
CCGCCAGATT CTCCCGCGCT GCATGTTATC CAGCATATTC GCGATGAATC ACACGATCAC 
GCGATTGGCG GGCACCGTAA AAAACGGGCG AAGGTCAAAA ATACCAGTTC CCTGGAAACC 
ATTGAAGGCG TCGGGCCAAA ACGCCGGCAA ATGTTGTTGA AATATATGGG CGGTTTGCAA 
GGTTTACGTA ACGCCAGCGT CGAGGAAATT GCAAAAGTGC CGGGTATTTC GCAAGGTCTG 
GCAGAAAAGA TCTTCTGGTC GTTGAAACAT TGA

Protein sequence

MSDQFDAKAF LKTVTSQPGV YRMYDAGGTV IYVGKAKDLK KRLSSYFRSN LASRKTEALV 
AQIQQIDVTV THTETEALLL EHNYIKLYQP RYNVLLRDDK SYPFIFLSGD THPRLAMHRG 
AKHAKGEYFG PFPNGYAVRE TLALLQKIFP IRQCENSVYR NRSRPCLQYQ IGRCLGPCVE 
GLVSEEEYAQ QVEYVRLFLS GKDDQVLTQL ISRMETASQN LEFEEAARIR DQIQAVRRVT 
EKQFVSNTGD DLDVIGVAFD AGMACVHVLF IRQGKVLGSR SYFPKVPGGT ELSEVVETFV 
GQFYLQGSQM RTLPGEILLD FNLSDKTLLA DSLSELAGRK INVQTKPRGD RARYLKLART 
NAATALTSKL SQQSTVHQRL TALASVLKLP EVKRMECFDI SHTMGEQTVA SCVVFDANGP 
LRAEYRRYNI TGITPGDDYA AMNQVLRRRY GKAIDDSKIP DVILIDGGKG QLAQAKNVFA 
ELDVSWDKNH PLLLGVAKGV DRKAGLETLF FEPEGEGFSL PPDSPALHVI QHIRDESHDH 
AIGGHRKKRA KVKNTSSLET IEGVGPKRRQ MLLKYMGGLQ GLRNASVEEI AKVPGISQGL 
AEKIFWSLKH