Gene Moth_0256 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0256
Symbol	uvrC
ID	3833219
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	262415
End bp	264256
Gene Length	1842 bp
Protein Length	613 aa
Translation table	11
GC content	61%
IMG OID	637828192
Product	excinuclease ABC subunit C
Protein accession	YP_429134
Protein GI	83589125
COG category	[L] Replication, recombination and repair
COG ID	[COG0322] Nuclease subunit of the excinuclease complex
TIGRFAM ID	[TIGR00194] excinuclease ABC, C subunit

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCTGG AGGAGAAACT GGCGCGCCTG CCGGACCACC CCGGCGTATA TATAATGCAC 
GATGCCAACG GGGCAATAAT CTATGTCGGC AAGGCGGCTT CCCTGAGGAA TCGGGTGCGT 
TCCTACTTCC GCGGCCAGCA CCAGCCGCGG ACGCAAGCCA TGGTCAGCCA CGTTGCCGAC 
TTTGAGTATA TCTTGACGGA CAACGAAGTC GAGGCCCTGA TCCTGGAGTG CAACCTGATC 
AAACAACACC GGCCGCGGTA TAACGTCAGC CTGAAGGACG ACAAGAGTTA CCCCTATATC 
AAGATAACCA CCCAGGAGGA TTTTCCCCGG ATCCAGATTA CGCGTTCCGT GACCCGTGAC 
GGTTCCCGTT ACTTCGGACC TTATACCAGC GCCGGTTCCC TGAAAGAAAC CCTGAAGCTC 
CTGCGCGGCC TTTTTCCCAT CCGGACCTGC AGGGATACCC CCCTGCAACC CCGCAGCCGT 
CCCTGCCTCA ACGCCCATAT CGGCCGCTGC CTGGCCCCCT GTGCCGGCCA GGTCGACCGG 
GAGACCTACC GGGAGGCGGT CGATAATGTC ATTATGTTCC TGGAAGGCAG GCATACGGCC 
CTGGTTAAGG AGCTGAAGGA GCAAATGGAA GCCGCCGCCG CGAGACTGGA GTTTGAAAAG 
GCGGCCAGGC TCCGGGACCA GCTCCGGGCG GTACAGGAGG TCTGTGAAAA GCAGAAACTG 
GCCGCCGCCA GCGGGGAAGA CGCCGACGCC ATCGCCTTCG CCCGGGAAGG GGAGGCTGCC 
CTGGGGCTCA TCTTTTTTAG CCGGGGCGGC AAGGTAATCG GCCGGGATCA CTTCTTCCTA 
ACAGGGAGCG AAGGGTTATC CCGGGGGGAG GTTATGGCGG CCCTGCTAAA AGAGTATTAT 
AGCCGGGGAG TAGAGATACC GCCGGAGATC CTCCTCCACG ACGAACCGGA GGATGCCGCC 
ACCATCGCCA GCTGGTTGAG CCGGCTCCGT GGCGGCAGGG TTAACCTGCG GGTGCCCAAA 
AGGGGTACGA AATTAAAACT CCTCCGGCTG GTTCACGAGA ACGCCGTAAG CCTCCTCCAG 
GAGCACCTGC TGACCCGCCG GCGCCAGGAG GAGGGCAGCA GGGCGGCCCT CCTGGAACTC 
CAGGAAATCC TGGAGTTACC GCGCTTGCCG CGGCGGATGG AGGCCTACGA TATCTCTAAC 
TTCCAGGGGA GCTCCCAGGT GGGAGCTATG GCCGTCTTTG TTGACGGCCG GCCGCTGCCT 
TCGGCGTACC GCCGGTTTCA GATTAAGACT GTCCGGGGGC CCAACGACTT CGCTTCCCTG 
CAGGAGGTTT TGAGCCGTCG TTTCCGGCGG GCTGCCGAAC AGGACCCCCA TTTTGCCGAT 
TTGCCGGATT TCGTCCTGAT TGACGGCGGC CTGGGCCAGC TCCACGCCGC CCGGGAGACC 
ATGGAAGCCA TGGGGGTAGG GTATATTCCC ACCTTTGGCC TGGCCAAGGA GGAGGAACTG 
TTATTCCGGG TGGGCACCTC CGAGCCCATC CGCCTGCCCC GTGAGAGCAA GGCCCTGCAA 
ATCCTGCAAC ACCTCCGGGA TGAGGTGCAC CGCTTTGCCA TCACCTATCA CCGGCAAAAG 
CGGGAAAAGA CAGCCTATCG CTCGGTCCTG GACGACATTC CCGGCGTAGG CCCCAAGCGT 
AAGAAGGCAT TATTACGTCA TTTTGGTTCC GTAGCAGCCA TCAGCAAAGC GACGCTGGAA 
GATTTACTGG CCGTAGAGGG GATGAACCGG ACCGTGGCGG CCCGCATCCT GGCCGGCCTG 
GGGAGGAGAA GTGATGGGGA AGATTCGACT GGTAGCCCTT GA

Protein sequence

MDLEEKLARL PDHPGVYIMH DANGAIIYVG KAASLRNRVR SYFRGQHQPR TQAMVSHVAD 
FEYILTDNEV EALILECNLI KQHRPRYNVS LKDDKSYPYI KITTQEDFPR IQITRSVTRD 
GSRYFGPYTS AGSLKETLKL LRGLFPIRTC RDTPLQPRSR PCLNAHIGRC LAPCAGQVDR 
ETYREAVDNV IMFLEGRHTA LVKELKEQME AAAARLEFEK AARLRDQLRA VQEVCEKQKL 
AAASGEDADA IAFAREGEAA LGLIFFSRGG KVIGRDHFFL TGSEGLSRGE VMAALLKEYY 
SRGVEIPPEI LLHDEPEDAA TIASWLSRLR GGRVNLRVPK RGTKLKLLRL VHENAVSLLQ 
EHLLTRRRQE EGSRAALLEL QEILELPRLP RRMEAYDISN FQGSSQVGAM AVFVDGRPLP 
SAYRRFQIKT VRGPNDFASL QEVLSRRFRR AAEQDPHFAD LPDFVLIDGG LGQLHAARET 
MEAMGVGYIP TFGLAKEEEL LFRVGTSEPI RLPRESKALQ ILQHLRDEVH RFAITYHRQK 
REKTAYRSVL DDIPGVGPKR KKALLRHFGS VAAISKATLE DLLAVEGMNR TVAARILAGL 
GRRSDGEDST GSP