Gene Nmul_A1271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1271
Symbol	uvrC
ID	3784286
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1461466
End bp	1463286
Gene Length	1821 bp
Protein Length	606 aa
Translation table	11
GC content	55%
IMG OID	637811356
Product	excinuclease ABC subunit C
Protein accession	YP_411966
Protein GI	82702400
COG category	[L] Replication, recombination and repair
COG ID	[COG0322] Nuclease subunit of the excinuclease complex
TIGRFAM ID	[TIGR00194] excinuclease ABC, C subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCAGGCAG AACCGGCTTT CGATGCCAAG GCGTTTTGTG CGGGCCTTCC ATCCCAGCCT 
GGAGTCTATC GCATGATGAA CTCAGCCGGG CAGGTGATTT ATGTCGGCAA GGCGATTGAT 
CTCAAGAAGC GTGTTTCTTC CTATTTTCAG AAGAATGGCC TGGCTCCCCG TACGCAACTC 
ATGGTTTCCC AGATCGCGGG AATCGAGACC ACCGTTACGC GATCCGAAGC AGAGGCCCTG 
TTACTCGAAA ACAACTTAAT AAAGAGCTTA AATCCTCGCT ATAACATACT ATTCAGGGAT 
GACAAATCAT ATCCCTACGT GATCTTGAGC GGCCACAGGT TTCCCCGGCT TGGATTTCAT 
CGCGGTCCGC TCGACAAGAA ACATCATTAT TTTGGTCCCT TCCCGAATGC GGGAATGGTG 
CGAGAGAGTA TCCAGTTGCT GCAAAAGGTA TTCCGGATTC GCACTTGCGA AGACAGTGTT 
TTCAGTAATC GTACACGCCC CTGCCTGCTC TACCAGATCA AACGCTGTAG CGGACCCTGC 
GTCGATCTGG TCAGCGAAGA AGTTTACGCG GAAGACGCAA GGGATGCGGA GCTATTTCTC 
CAGGGCAAGC AAACGGAGGT TCTGAAAAGC ATTACGAGAA AAATGCATGA GGCCGCCGAG 
GAACAGGAAT ACGAGCAAGC GGCGCTGTTT CGCGACCAGA TTCAGTCTCT GCGAAAGATT 
TGCGAAAGGC AATTCGTGGA TAGCGGGCGA GCGCTGGATG CCGATATCGT CGCCTGCGTG 
GCAGAGAATA ACGGCGGCGG ACGGGTGTGC GTCAACCTTG CCATGGTCAG GGGAGGACGC 
CACCTCGGGG ACAAGAGTTT TTTTCCGCAA AACGCGGAAG GATACGATCT CGCTACGGTG 
GCGGAAGCAT TCCTGGCCCA GCACTACCTC AATCGCAGCA TCCCAGATCT GATCATCGTG 
GGCGAGAGAG TTCCGCGGGA ATCTCTCCAG GCTCTGCTCA CTCAGCAGGC TGGCCATAAA 
GTGATCATCA ATGTGAATCC GATAGGTAGC CGGCGTGTTT GGCTGGAAAT GGCGACAGAA 
AATGCCGCCC TTGCCCTGGA ACAAATGCTG GGCCGCCAGG CGAGCCAGGA GGAGCGGCTG 
CTAGCCTTGC AGCAGGCGCT GGATATGACC GGGTTGAGCC GGATCGAATG TTTCGATATC 
AGTCATACAA TGGGCGAAGC CACCATCGCT TCCTGCGTGG TTTATGACAA CTTCGGCATG 
CGCAATAGCG AGTACCGCCG CTACAATATT ACTGATATCA CGCCGGGAGA CGATTATGCG 
GCCATGCGCG ATGTTCTGTC ACGGCGCTAC CATAAGATTG CGGAAGGCGA GGGAAATCTG 
CCTGATCTGA TCCTGATCGA CGGGGGAAGA GGGCAGATCA ACGCTGCTCT CGAGGTCATG 
GTAGAGCTGG GGTTGAATGA TGCCAACCTG GTAGGCGTGG CAAAAGGCGA GGAGCGCAAG 
CCGGGACTGG AGCAATTGAT TTTCCCAGGG GTGAAAAAAC CACTACAATT ATCAAAGGAT 
CATCCCGGAT TGCATCTCAT CCAGCAGATT CGGGATGAAG CGCATCGCTT TGCAATTTAC 
GGTCATCGCG CAAAACTCGG CAAGGCCCGC GTCAGTTCAA GCCTGGAGCA GATCGCCGGT 
ATCGGCGCCA AGCGCCGGCA AAGTTTGCTG GCAAGGTTTG GCGGCCTGAA AGGCGTGCGC 
ACTGCGAGCA TCGAAGAATT GCAGCAAGCT GACGGCATCA GCCGCGCGCT CGCAGAGAAA 
ATTTACAGGG AACTGCATTG A

Protein sequence

MQAEPAFDAK AFCAGLPSQP GVYRMMNSAG QVIYVGKAID LKKRVSSYFQ KNGLAPRTQL 
MVSQIAGIET TVTRSEAEAL LLENNLIKSL NPRYNILFRD DKSYPYVILS GHRFPRLGFH 
RGPLDKKHHY FGPFPNAGMV RESIQLLQKV FRIRTCEDSV FSNRTRPCLL YQIKRCSGPC 
VDLVSEEVYA EDARDAELFL QGKQTEVLKS ITRKMHEAAE EQEYEQAALF RDQIQSLRKI 
CERQFVDSGR ALDADIVACV AENNGGGRVC VNLAMVRGGR HLGDKSFFPQ NAEGYDLATV 
AEAFLAQHYL NRSIPDLIIV GERVPRESLQ ALLTQQAGHK VIINVNPIGS RRVWLEMATE 
NAALALEQML GRQASQEERL LALQQALDMT GLSRIECFDI SHTMGEATIA SCVVYDNFGM 
RNSEYRRYNI TDITPGDDYA AMRDVLSRRY HKIAEGEGNL PDLILIDGGR GQINAALEVM 
VELGLNDANL VGVAKGEERK PGLEQLIFPG VKKPLQLSKD HPGLHLIQQI RDEAHRFAIY 
GHRAKLGKAR VSSSLEQIAG IGAKRRQSLL ARFGGLKGVR TASIEELQQA DGISRALAEK 
IYRELH