Gene NATL1_10011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_10011
Symbol	uvrC
ID	4780129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	921564
End bp	923486
Gene Length	1923 bp
Protein Length	640 aa
Translation table	11
GC content	31%
IMG OID	640084279
Product	excinuclease ABC subunit C
Protein accession	YP_001014824
Protein GI	124025708
COG category	[L] Replication, recombination and repair
COG ID	[COG0322] Nuclease subunit of the excinuclease complex
TIGRFAM ID	[TIGR00194] excinuclease ABC, C subunit

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.404154
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.496638
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAACTAA TACCGTTAAT AAGGGACAAG TCAAGATTAT CGGATTTTTT GAAGGATATA 
CCTAATGATC CTGGATGTTA TTTGATGAAA GATGGTGAGG ATAGATTGCT TTATGTTGGT 
AAATCTAAAA AGTTAAGGAA TAGAGTTAGA AGTTATTTTC GTTCAGGTAA TGAATTAAGT 
CCTAGAATAT CTTTAATGGT GAGACAAGTT GCAGATATTG AATTGATAGT TACTGATAAT 
GAAAGTGAAG CATTAACATT AGAATCAAAT TTAATTAAAT CTCACCAACC ATATTTCAAT 
GTCTTACTAA AAGATGATAA AAAGTATCCC TATGTTTGTA TTACTTGGGG TGATAAATAT 
CCAAGAATTT TTTTAACTAG AAAAAGGCGT CAACGACAAT TAAAAGATAA ATATTATGGT 
CCTTATGTAG ATGTTTATTT ACTTAGAAAA ACTCTATTTA GTATAAAAAA ATTGTTTCCA 
CTCAGGCAAA GAAGAATTCC GCTTTATAAG GATAGAACAT GCCTTAATTA TTCAATTGGA 
AGATGCCCTG GTGTTTGCCA GGAAGAAATA AGTTCAGAAG ATTACAAAAA CACTTTAAAA 
AGAGTTGAAA TGATATTTCA AGGAAGAACG GATGAATTAA GAATATTATT AGAAAAACAA 
ATGATTTCTT TTTCAGAGTC ATTGAAATTT GAAGAGGCTG GATCAGTTAG AGATCAGCTT 
AAGGGTATAG ATAGATTGTA TGAATCTCAA AAGATGATCA TACCAGATTC ATCTGTTTGT 
AGGGATATAA TTGCAATGGC ATCAGAAGAA AATATAAGCT CAGTACAAAT TTTTCAAATG 
CGATCAGGTA AATTAATTGG TCGTTTAGGA TATTTCTCAG ATAATAGTAA TTTTAATTCA 
TCTCAAATAC TTCAACAAGT AATAGAAAAT CATTATTCAA ATGTAGATCC TGTTGAAATC 
CCATCAGAAA TATTAGTTCA ACATCAACTT GTAAATAATA TTTTAATTTC AGATTGGCTT 
AGTGAAATAA AAAAGCAAAA AGTTAATATA AATGTTCCTA AAAGATCTAG AAAAGCAGAG 
ATTATTAAAC TCGTAGAAAA AAATGCTAAT TTAGAATTAC AAAGAATTAA ACAATCTCAT 
GATAAGAATT TAGTTGAACT TGATGATCTG ACTAATATCC TTGATTTAGA AAATATTCCA 
AAGAGAATTG AATGTTATGA CATAAGCCAT ATCCAAGGAA GTGACGCTGT TGCATCACAA 
GTAGTATTTA TTGATGGTAT TGCGGCAAGG CAACACTATA GAAGATATAA AATTAAAAGC 
CCAAATATAA AAATTGGTCA CAGCGACGAT TTCGAATCAA TGGCTGAAGT GATAACTAGA 
AGATTTAGAA GATGGGCTCG TTTTAAAGAA GAAGGTGGAG ATATTAATGC CCTACTAAGT 
AATCAAAGCA GTGTTCTAGA TAACCTGAAT TTAAATGACT GGCCAGATCT CGTTGTGATA 
GATGGAGGTA AAGGTCAATT AAGTTCTGTC GTAGCTGCTC TTGAGGAACT TAAACTTGAT 
CAAAATTTAA ATGTTATATC TTTAGCAAAA AAGAAGGAGG AAGTTTTTAT TCCTAATGTT 
AAACAATCAT TAGTTACCGA ATCAAATCAA CCAGGAATGC TTTTGCTAAG GAGACTGAGA 
GATGAAGCTC ATAGATTTGC AATTACTTTT CATAGGCAAA AAAGGAGTCA ACGGATGAAA 
CGTTCTCAGT TAAATGAAAT ACCGGGTCTT GGACCTCAAA GAATAAAATT ATTGCTTGAG 
CATTTCAGGT CAATTGAGGC AATACAAATG GCTACTTTTT CTGAACTTTC ATCAACACCC 
GGCTTAGGCA GATCAACTGC TGTTGTTATT AGAAACTATT TTCATCCCGA TAAAAATAAA 
TAA

Protein sequence

MELIPLIRDK SRLSDFLKDI PNDPGCYLMK DGEDRLLYVG KSKKLRNRVR SYFRSGNELS 
PRISLMVRQV ADIELIVTDN ESEALTLESN LIKSHQPYFN VLLKDDKKYP YVCITWGDKY 
PRIFLTRKRR QRQLKDKYYG PYVDVYLLRK TLFSIKKLFP LRQRRIPLYK DRTCLNYSIG 
RCPGVCQEEI SSEDYKNTLK RVEMIFQGRT DELRILLEKQ MISFSESLKF EEAGSVRDQL 
KGIDRLYESQ KMIIPDSSVC RDIIAMASEE NISSVQIFQM RSGKLIGRLG YFSDNSNFNS 
SQILQQVIEN HYSNVDPVEI PSEILVQHQL VNNILISDWL SEIKKQKVNI NVPKRSRKAE 
IIKLVEKNAN LELQRIKQSH DKNLVELDDL TNILDLENIP KRIECYDISH IQGSDAVASQ 
VVFIDGIAAR QHYRRYKIKS PNIKIGHSDD FESMAEVITR RFRRWARFKE EGGDINALLS 
NQSSVLDNLN LNDWPDLVVI DGGKGQLSSV VAALEELKLD QNLNVISLAK KKEEVFIPNV 
KQSLVTESNQ PGMLLLRRLR DEAHRFAITF HRQKRSQRMK RSQLNEIPGL GPQRIKLLLE 
HFRSIEAIQM ATFSELSSTP GLGRSTAVVI RNYFHPDKNK