Gene Tfu_2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tfu_2021
Symbol	uvrC
ID	3580894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermobifida fusca YX
Kingdom	Bacteria
Replicon accession	NC_007333
Strand	-
Start bp	2361510
End bp	2363480
Gene Length	1971 bp
Protein Length	656 aa
Translation table	11
GC content	68%
IMG OID	637685714
Product	excinuclease ABC subunit C
Protein accession	YP_290077
Protein GI	72162420
COG category	[L] Replication, recombination and repair
COG ID	[COG0322] Nuclease subunit of the excinuclease complex
TIGRFAM ID	[TIGR00194] excinuclease ABC, C subunit

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.387091
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGTCC GCCCGACTTT GCGTCCGAAG CCCGGATCGA TCCCCACCGA TCCGGGGGTC 
TACCGTTTCC GGGACGAGCA CGGCCGTGTG ATCTACGTCG GCAAGGCGAA GAACCTGCGG 
GCCCGCCTGT CCTCGTACTT CCAGGATTTC AGCGCGCTGC ACCCCCGCAC CCAGACCATG 
ATCTCCACCG CCGCCGACGT CGACTGGACG GTGGTGAACA CCGAGGTGGA GGCCCTGCAA 
CTGGAGTATT CCTGGATCAA GGAGTACTCT CCGCGGTTCA ATGTCCGCTA CCGCGACGAC 
AAAAGCTACC CCTACTTGGC GGTGACCCTC AACGAAGAGT TCCCCCGGGT GCAGGTGATG 
CGCGGGGCCC GCCGCCGCGG GGTGCGCTAC TTCGGGCCCT ACTCCTATGC GTGGGCGATC 
CGCGACACCG TCGACCTGCT GCTCCGCGTG TTCCCGGTGC GCACCTGCTC GGCTGGGGTG 
TTCAAACGCG CTCGGTCCAG TGGCCGCCCT TGCCTGCTGG GCTATATCGA CAAGTGCTCT 
GCCCCGTGCG TGGGGCGGAT CGGCGTGGAG GAGTACCGGG CGCTCGCCGA GGATTTCTGC 
GCTTTCATGG CAGGGGAGAC CGGCCGGTTC CTGCGGCAGT TGGAAGCCGA GATGAAACAG 
GCGGCGGCCG CGCAGGAGTA CGAGCGTGCC GCCCGGATCC GTGACGATAT CCAGGCGCTG 
CGCACGGTCA TGGAGAAGCA GGCGGTGGTG CTCGGGGACA GCACCGACTG CGACGTGATC 
GCGATCGCCG AGGACCAGTT GGAAGCCGCG GTCCAAGTGT TCTACGTGCG CGGCGGCCGG 
ATCCGCGGGG AGCGCGGCTG GGTGGTGGAC AAAGTCGAGG ACGTCTCCAC GGGGAAACTC 
GTCGAGCAGT TCCTGGCCCA GACGTACGGG GGTGCCGACG ATGAGGAGTC CACCACGGCG 
ATTCCCCGCG AAGTGCTGGT GTCGGCCGAG CCCGCCGACC GGGACGCGGT CGTCGCCTGG 
CTGTCGAAGC GGCGCGGCGC GGCCGTGGAT GTGCGGGTCC CCCAGCGCGG CGACAAACGG 
GCCCTCATGG AGACCGTGCT CAAAAACGCG GAGCAGACCC TGGCCCGCCA CAAGAGCCAG 
CGCGCTTCCG ACTTGACGAC CCGGTCCAAA GCCCTGGCGG AGATCGCGGA GGCGCTCGGT 
CTGGCGGAGG CGCCGCTGCG CATCGAATGC TTCGACATCT CCACCCTGCA GGGGGAGCAC 
ACTGTGGCGT CCATGGTGGT GTTCGAAGAC GGTCTGGCCC GCAAGTCCGA GTACCGGCGG 
TTCAGTATCC GCGGGGCGGA AGGCGCGGAC AGTGACGTGG CCGCGATGTA CGAGGTCATC 
AGCCGGCGGT TCACCCGTTA CCTGGAGGAG AGCCAGCGTG TCGGCGAACT GGACACGCTG 
GGGGAGAGCG GTGCGCCGCA GGGGGCGGAG CGGAAGGCCC CCCGTTTCGC CTATCCCCCT 
AACCTCGTCG TCGTGGACGG CGGCCGTCCG CAGGTCGCGG CTGCCCAGCG GGCCTTGGAC 
GATCTGGGGA TCGAGGATGT GGCGGTCTGC GGGCTGGCGA AACGCTTGGA GGAAGTGTGG 
TTGCCCGGGG AAGAGGACCC GATCATCCTG CCGCGGACGA GTGAGGGGCT CTACCTGCTG 
CAGCGTGTGC GAGACGAGGC GCACCGGTTT GCGATCTCCT ACCATCGACG CAAGAGAGCG 
AAGGCGCTGA CAGCCAGCGT GCTGGATGAC ATCCCCGGGC TGGGGCCGGT CCGCCGCGCC 
GCTCTGCTGA AGCATTTCGG GTCGGTGCGG CGGCTGGCGC AGGCCACGGC CGCGGAGATC 
GCTGAGGTGC CGGGGATCGG GGAGCGGACC GCGCAGACTA TCTACGAGCG GCTCACGAGC 
GTGGAGGGCG GACAGCGGAC ACAACCGGAG AACAGCAAGG CAGACGAGTG A

Protein sequence

MTVRPTLRPK PGSIPTDPGV YRFRDEHGRV IYVGKAKNLR ARLSSYFQDF SALHPRTQTM 
ISTAADVDWT VVNTEVEALQ LEYSWIKEYS PRFNVRYRDD KSYPYLAVTL NEEFPRVQVM 
RGARRRGVRY FGPYSYAWAI RDTVDLLLRV FPVRTCSAGV FKRARSSGRP CLLGYIDKCS 
APCVGRIGVE EYRALAEDFC AFMAGETGRF LRQLEAEMKQ AAAAQEYERA ARIRDDIQAL 
RTVMEKQAVV LGDSTDCDVI AIAEDQLEAA VQVFYVRGGR IRGERGWVVD KVEDVSTGKL 
VEQFLAQTYG GADDEESTTA IPREVLVSAE PADRDAVVAW LSKRRGAAVD VRVPQRGDKR 
ALMETVLKNA EQTLARHKSQ RASDLTTRSK ALAEIAEALG LAEAPLRIEC FDISTLQGEH 
TVASMVVFED GLARKSEYRR FSIRGAEGAD SDVAAMYEVI SRRFTRYLEE SQRVGELDTL 
GESGAPQGAE RKAPRFAYPP NLVVVDGGRP QVAAAQRALD DLGIEDVAVC GLAKRLEEVW 
LPGEEDPIIL PRTSEGLYLL QRVRDEAHRF AISYHRRKRA KALTASVLDD IPGLGPVRRA 
ALLKHFGSVR RLAQATAAEI AEVPGIGERT AQTIYERLTS VEGGQRTQPE NSKADE