Gene SNSL254_A2109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2109
Symbol	uvrC
ID	6484935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	2041368
End bp	2043200
Gene Length	1833 bp
Protein Length	610 aa
Translation table	11
GC content	54%
IMG OID	642737465
Product	excinuclease ABC subunit C
Protein accession	YP_002041212
Protein GI	194445436
COG category	[L] Replication, recombination and repair
COG ID	[COG0322] Nuclease subunit of the excinuclease complex
TIGRFAM ID	[TIGR00194] excinuclease ABC, C subunit

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0217985
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.00000000000000291711
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAGTGAAA TATTTGACGC AAAGGCGTTT TTGAAAACCG TTACCAGCCA ACCCGGTGTC 
TATCGTATGT ATGACGCCGG CGGTACGGTT ATTTATGTCG GTAAAGCAAA AGACCTGAAA 
AAGCGTCTTT CCAGCTACTT TCGCAGCAAC CTGGCTTCGC GTAAAACCGA AGCGCTAGTT 
GCGCAAATTC AACACATTGA TGTCACGGTA ACGCATACCG AAACGGAAGC GCTGCTGCTT 
GAGCATAATT ACATCAAGTT GTATCAACCG CGTTACAACG TGTTGTTGCG TGATGATAAA 
TCCTATCCTT TTATTTTTCT GAGCGGCGAT ACCCATCCGC GTCTGGCGAT GCACCGTGGC 
GCCAAACATG CGAAAGGCGA GTACTTCGGC CCATTTCCTA ATGGCTATGC CGTGCGGGAA 
ACGCTGGCGC TGTTACAGAA AATTTTCCCT ATCCGCCAGT GCGAAAACAG CGTATATCGC 
AACCGCTCGC GTCCTTGCCT GCAATATCAG ATTGGCCGCT GTTTAGGCCC CTGCGTTGCA 
GGACTGGTCA GCGAGGAGGA GTATGCGCAA CAGGTGGAGT ATGTCCGGTT GTTTTTGTCC 
GGTAAGGACG ACCAGGTCTT AACACAGCTG ATTGCCCGGA TGGAAAAGGC CAGCCAGGAT 
CTGGCATTTG AAGAGGCGGC GCGTATTCGC GATCAGATCC AGGCGGTACG CCGGGTCACG 
GAAAAACAGT TTGTCTCCAA TGCGGGCGAC GATCTCGACG TGATCGGCGT GGCTTTTGAT 
GCGGGTATGG CCTGTGTGCA TGTGCTGTTT ATTCGCCAGG GTAAGGTGCT GGGCAGCCGC 
AGCTATTTTC CAAAAGTACC TGGCGGTACG GAACTGGGCG AAGTGGTGGA AACCTTTGTC 
GGGCAGTTTT ACCTGCAGGG TAGCCAGATG CGCACGCTAC CGGGCGAGAT ACTGCTCGAT 
TTTAATCTGA GTGATAAAAC GCTGCTGGCC GATTCGTTGT CGGAACTTGC CGGACGGCGT 
ATTCATGTCC AGACAAAACC GCGCGGCGAT CGCGCCCGTT ATCTCAAGCT GGCGCGGACC 
AACGCGGCAA CGGCCTTAAT CACTAAACTC TCGCAGCAGT CCACCATCAC GCAGCGTTTG 
ACCGCGCTGG CGGCGGTATT AAAACTTCCT GCGATCAAGC GGATGGAATG TTTTGACATC 
AGCCATACCA TGGGGGAGCA AACGGTCGCA TCCTGTGTGG TATTTGACGC TAACGGGCCG 
TTACGCGCCG AGTATCGTCG TTATAATATC GCGGGCATCA CGCCGGGTGA TGACTACGCG 
GCGATGAATC AGGTGCTACG TCGGCGTTAT GGCAAGGCCA TAGAAGAAAG TAAGATTCCG 
GATGTTATTC TGATCGACGG CGGAAAAGGG CAGCTCGCCC AGGCGAAAGC CGTTTTCGCT 
GAGCTGGATG TCCCCTGGGA TAAGCATCGT CCTTTGCTGC TTGGCGTCGC CAAAGGCGCG 
GACAGAAAGG CCGGTCTGGA AACACTCTTT TTTGAACCGG AAGGCGAGGG GTTTAGCCTG 
CCGCCGGACT CGCCGGCGCT GCATGTTATT CAGCATATTC GCGATGAGTC GCACGATCAC 
GCGATCGGCG GGCACCGTAA AAAACGCGCG AAGGTTAAAA ATACCAGTAC GCTGGAAACT 
ATTGAAGGCG TTGGGCCTAA ACGTCGCCAG ATGCTGCTGA AATATATGGG CGGTTTGCAA 
GGACTACGTA ACGCCAGCGT AGAAGAAATT GCAAAAGTGC CGGGTATTTC GCAAGGTCTG 
GCAGAAAAGA TCTTCTGGTC GTTGAAACAT TGA

Protein sequence

MSEIFDAKAF LKTVTSQPGV YRMYDAGGTV IYVGKAKDLK KRLSSYFRSN LASRKTEALV 
AQIQHIDVTV THTETEALLL EHNYIKLYQP RYNVLLRDDK SYPFIFLSGD THPRLAMHRG 
AKHAKGEYFG PFPNGYAVRE TLALLQKIFP IRQCENSVYR NRSRPCLQYQ IGRCLGPCVA 
GLVSEEEYAQ QVEYVRLFLS GKDDQVLTQL IARMEKASQD LAFEEAARIR DQIQAVRRVT 
EKQFVSNAGD DLDVIGVAFD AGMACVHVLF IRQGKVLGSR SYFPKVPGGT ELGEVVETFV 
GQFYLQGSQM RTLPGEILLD FNLSDKTLLA DSLSELAGRR IHVQTKPRGD RARYLKLART 
NAATALITKL SQQSTITQRL TALAAVLKLP AIKRMECFDI SHTMGEQTVA SCVVFDANGP 
LRAEYRRYNI AGITPGDDYA AMNQVLRRRY GKAIEESKIP DVILIDGGKG QLAQAKAVFA 
ELDVPWDKHR PLLLGVAKGA DRKAGLETLF FEPEGEGFSL PPDSPALHVI QHIRDESHDH 
AIGGHRKKRA KVKNTSTLET IEGVGPKRRQ MLLKYMGGLQ GLRNASVEEI AKVPGISQGL 
AEKIFWSLKH