Gene Hhal_0022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0022
Symbol	uvrC
ID	4710239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	23291
End bp	25132
Gene Length	1842 bp
Protein Length	613 aa
Translation table	11
GC content	64%
IMG OID	639854480
Product	excinuclease ABC subunit C
Protein accession	YP_001001619
Protein GI	121996832
COG category	[L] Replication, recombination and repair
COG ID	[COG0322] Nuclease subunit of the excinuclease complex
TIGRFAM ID	[TIGR00194] excinuclease ABC, C subunit

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAGG TTTCGGCAGA GCCAACCCCT GGAGTTGAGG CGCTGCGCGA GCGGGTGCGC 
GGCCTCCCGG AGCGACCGGG TGTCTACCGC ATGCTCAGTG CCGAAGGCAC CATCATCTAC 
GTGGGCAAGG CGCGCAACCT CCGCCGCCGA GTCTCCAGTT ATTTCACCCC GTCACGAAAG 
ACTCCCAAGA CCGAGCGGCT CGTCCAGCTC ATCGCCGATG TCCAGATCAC GGTGACCCAC 
ACCGAGGCCG AGGCGTTGAT CCTGGAGAAC AACCTGATCA AGGAACATCG GCCTCGATAC 
AACGTCCTGC TAAGGGACGA CAAGTCGTAC CCGTATATCT ACCTCTCGAG TCATCAGCAG 
TTTCCGCGTC TGGGATACCA TCGCGGGGCA CGACAGGGAG CGGGACGATT CTTTGGCCCT 
TACCCGAACT CCAATGCGGT GCGCGAGACG CTCGGCTACC TGCAGAAGGT CTTCCCCATC 
CGACAGTGCC GCGATACCTT CTTCCGCAAT CGCTCGCGTC CCTGCCTGCA GTATCAGATT 
CGCCGCTGCA CGGCGCCCTG TGTCGGCTAC ATCAGCGAGG AGGACTACCG CCGCGACGTG 
CGCGACGTTG AGTTCTTCCT GGAGGGGCGC TCCGGCGAGG TCATCGCCGA GCTCGTCCGG 
CGCATGGAAG AGGCTGCGGA GAACCTCGAG TTCGAGCAGG CGGCGCGCCT GCGCGACCGC 
ATCGCCAATC TCCGGCATAT CCAGCAGCGT CAGTACGTTG CCCAGGATCG GGACGACAAC 
ATGGATATCG TCGCCTGCGT GGCGGAAGGC GATACGGCGT GTGTCCAGGT CTTCTTCATC 
CGGGGAGGGA GCAGTCTGGG CAACCAGTCC TACTTCCCCA ACACCCCGTC AGGTAGCCGC 
GAGTCGGATA TCCTGGCCAG CTTCCTGGCC CAACACTATC TCGGTCGTGT AGCGCCGCCC 
GAAGTGGTGA TCAATCGCCC GGTCCGGGAG CAGCGGCTCC TTGAGCAGGC CCTGCGCACC 
GCGTCCGGTG GAACGGTGGC GATCCGTCAC CGTGTGCGCG GCGATCGCCG GCGCTGGGTG 
GAGATGGCGG AAGAAAATGC TCGTTACGCG CTCTCCGCGC GCAGCGCCTC GACGGCCAGT 
CAGCAGCGGC GGTACAGCGC CCTTGCCGAG GTCATCGATA GCGATGCCCC GCCAGAGCGG 
ATCGAGTGTT TCGACATCTC GCACACCGCT GGTGAGGCCA CCGTAGCCTC CTGCGTCGTC 
TTCAATCGGG AGGGACCGGT CAAGAGCGAC TACCGCCGCT TTAATATCCG TAATGTGACC 
GCCGGTGATG ACTACGCAGC CATGCATCAG GCACTGACCC GCCGCTACCG GCGCGTTAAG 
AGCGGCGAGG CGCCGCTGCC CGACCTCTTG CTAATCGATG GAGGAAAGGG GCAAGTTGCA 
CAGGCACGGG ATGTCCTCGA CGAACTGGGC ATCGACGGCG TGGCACTAAT GGGCATCGCC 
AAGGGGCCGG AGCGCCGCCC CGGAGAGGAG ACCCTATTGC TCGACGACGG GGAGCGGGAG 
ATCGAGTTAC CGGCCGACTC TCCCGCACTC CACCTGTTGC AGCAGGTTCG CGACGAGGCC 
CACCGCTTTG CGGTCAGTGG CCACCGCCAG CGCCGCGGCA AGGCGCGGCG GGAGTCGATC 
CTCGAGGAGA TCCCCGGCCT GGGGCCAAAG CGCCGCCAGA GCCTTTTGAA ACACTTCGGC 
GGGATCCAAG GCATTCGCCA GGCCGGCATC GAGGATCTGG CTCGCGTACC GGGCATCCAT 
CGATCGCTCG CTCAACGGAT CTACGACACG TTCCACGGTT AG

Protein sequence

MNKVSAEPTP GVEALRERVR GLPERPGVYR MLSAEGTIIY VGKARNLRRR VSSYFTPSRK 
TPKTERLVQL IADVQITVTH TEAEALILEN NLIKEHRPRY NVLLRDDKSY PYIYLSSHQQ 
FPRLGYHRGA RQGAGRFFGP YPNSNAVRET LGYLQKVFPI RQCRDTFFRN RSRPCLQYQI 
RRCTAPCVGY ISEEDYRRDV RDVEFFLEGR SGEVIAELVR RMEEAAENLE FEQAARLRDR 
IANLRHIQQR QYVAQDRDDN MDIVACVAEG DTACVQVFFI RGGSSLGNQS YFPNTPSGSR 
ESDILASFLA QHYLGRVAPP EVVINRPVRE QRLLEQALRT ASGGTVAIRH RVRGDRRRWV 
EMAEENARYA LSARSASTAS QQRRYSALAE VIDSDAPPER IECFDISHTA GEATVASCVV 
FNREGPVKSD YRRFNIRNVT AGDDYAAMHQ ALTRRYRRVK SGEAPLPDLL LIDGGKGQVA 
QARDVLDELG IDGVALMGIA KGPERRPGEE TLLLDDGERE IELPADSPAL HLLQQVRDEA 
HRFAVSGHRQ RRGKARRESI LEEIPGLGPK RRQSLLKHFG GIQGIRQAGI EDLARVPGIH 
RSLAQRIYDT FHG