Gene GM21_4046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_4046
Symbol	uvrC
ID	8139420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4628973
End bp	4630922
Gene Length	1950 bp
Protein Length	649 aa
Translation table	11
GC content	65%
IMG OID	644871662
Product	excinuclease ABC subunit C
Protein accession	YP_003023820
Protein GI	253702631
COG category	[L] Replication, recombination and repair
COG ID	[COG0322] Nuclease subunit of the excinuclease complex
TIGRFAM ID	[TIGR00194] excinuclease ABC, C subunit

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	81
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTACTC AGGCGATGAT CGAGAACTTC CCCTCCTCCC CCGGCGTCTA CCTCATGAAG 
AGCGCCGACG ACACCGTCAT CTACGTCGGC AAAGCGCGCA ATCTCAAGAA AAGAGTCCGC 
TCCTACGCGG GAGACACCCG CGATTCACGG ATCCACATCC GCTTCATGGT GCAACTGGTC 
CATTCGGTCG ACTACCTGGT CACCGACACG GAGAAGGAAG CGCTCATCCT CGAAAACACG 
CTGATCAAGC AGCACCGCCC CAAGTACAAC ATCAACCTGC GCGACGACAA GACCTACTTC 
TCGCTCAGGA TGGACATGAA GGAGCAGTTC CCGCGCCTCT CCATCGTCCG GAAGATCCCC 
TCCGACGGCG CGCGCTACTT CGGCCCCTAC GCCTCGGCCA CCGCGGCCAA GGAAGTGCTG 
AAGCAGCTCT ACAAGATGTT CCCGCTGCGC CACTACCCGC TTGCCACCTG CATGGCGCGA 
AAGCGCCCCT GCCTGTACCA CCAGATCAAG CAGTGCTCCG CACCTTGCTG CGGCCTCATC 
TCGGCCGCCG AATATGCGGC GCTGGCCCAG GGGGCGGCCC TCTTCCTGGA GGGGAAGAAC 
AACGAGGTGG CGCGATTGTA CCGGTCCAAG ATGAACCTGG CCTCCGAGCA GATGCGCTAC 
GAGGACGCGG CCCGCTACCG GGACCTGCTG CGCGCCATTG AGGTGACGGT CGAGCGGCAG 
AAGATGGTGG CGCAAAGCGG CGACAGCGAC GTCTTCGGCG TGCACCGCGA GGCGGACCGG 
ATGCAGATCG CCCTTTTACA CATCCGCGGC GGCACCCTGA CCGGCGGGCG CAGCTTCCTC 
TTCGACTGGG AGCTGGAGAC CGAGGAGGGT CTTGCCTCCT TCCTGAACGA GTACTACGAC 
CTCGATGCGC CTATCCCGCC GCAGGTGCTG ATCCCGCTTC CCATCGCCGA GCCCGCCGCG 
CTGGAGGAAC TCCTCTCGGA AAAAGCAGGA AAGAAGGTGA CCATCGCGGT GCCGCAGCGC 
GGCCCGAAAC TCGAGATGGT GAAGCTCGCC GGGAAAAACG CCGAGACCGC TGCCCAGGAG 
CGCCTGGCGC GGGAGAGTTC CTCCGCGACG CTTCTGACCG AACTGGCCGA GAAGCTGAAC 
CTCCCCCACC CCCCGAGGAG GATCGAGTGC TACGACATCT CCAACATCCA GGGGGAGATG 
GCGGTCGGGA GCCGGGTGGT CTTCATCGAC GGCAGGGCCG ACAAGTCCCT GTACCGGCGC 
TACCGGATCA AGGGGGTGCT GCAGTCGGAC GACTTCGCAA TGATGCGCGA GGTGCTCTCG 
CGCAGGTTCA AGGCCGACAG CCACGAAGAG AAGCCGGACC TGATCGTGGT CGACGGCGGT 
CTCGGGCAGT TGGGCGTCCT GAACGCGGTG CTCGACGAGC TTGAGGTCAC CGGAGTGGAG 
GCGGCGGGGC TTGCCAAGAG CCGCGTGGCC CGCGACATGG AGAGCGAGGA AATCGAGCGC 
AGCGACGAGC GCGTGTTCCG CCCCGGGCGC AAGAATGCGA TCGCACTCAG GCAGAGTTCC 
GCTCCGCTAT TGCTCTTGGT GCGCATCAGG GACGAGGCGC ACCGCTTCGC CGTCACCTAC 
CATAAGGACG TGCGCAGCAA GGTCCTGACC GGGTCCGAGC TGGACGGAGT CGCGGGTATC 
GGCGAGAAGA GGAAGAAGGC GCTGTTGAAG CATTTCGGGA GTCTCAAGCG GGTGAAGGAG 
GCGACGCTGG AAGAGCTGAA GGGCGCGCCC GGGATGACCG AAAGCGCGGC GAGGGCGTTG 
GTGGAACGGT TGCATGGCGG CCCCCTCCCC AACCCTCCCC CTCCTGGGGA GGGAGCGATG 
GGCGACGGCA GCATACCCTC TCCTAGGAAT GGAGTGATGG ACGACAGCAT ACCCTCTCCC 
TCTGGGAGAG GGTGGCCGAA GGCCGGGTGA

Protein sequence

MITQAMIENF PSSPGVYLMK SADDTVIYVG KARNLKKRVR SYAGDTRDSR IHIRFMVQLV 
HSVDYLVTDT EKEALILENT LIKQHRPKYN INLRDDKTYF SLRMDMKEQF PRLSIVRKIP 
SDGARYFGPY ASATAAKEVL KQLYKMFPLR HYPLATCMAR KRPCLYHQIK QCSAPCCGLI 
SAAEYAALAQ GAALFLEGKN NEVARLYRSK MNLASEQMRY EDAARYRDLL RAIEVTVERQ 
KMVAQSGDSD VFGVHREADR MQIALLHIRG GTLTGGRSFL FDWELETEEG LASFLNEYYD 
LDAPIPPQVL IPLPIAEPAA LEELLSEKAG KKVTIAVPQR GPKLEMVKLA GKNAETAAQE 
RLARESSSAT LLTELAEKLN LPHPPRRIEC YDISNIQGEM AVGSRVVFID GRADKSLYRR 
YRIKGVLQSD DFAMMREVLS RRFKADSHEE KPDLIVVDGG LGQLGVLNAV LDELEVTGVE 
AAGLAKSRVA RDMESEEIER SDERVFRPGR KNAIALRQSS APLLLLVRIR DEAHRFAVTY 
HKDVRSKVLT GSELDGVAGI GEKRKKALLK HFGSLKRVKE ATLEELKGAP GMTESAARAL 
VERLHGGPLP NPPPPGEGAM GDGSIPSPRN GVMDDSIPSP SGRGWPKAG