Gene Ndas_3014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3014
Symbol
ID	9246867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3597967
End bp	3599994
Gene Length	2028 bp
Protein Length	675 aa
Translation table	11
GC content	72%
IMG OID
Product	excinuclease ABC, C subunit
Protein accession	YP_003680930
Protein GI	297561956
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.45539
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGCGA CTCCTCACCT GCGCCCCGCG CCCGGTTCCA TCCCCACCGA CCCGGGCGTG 
TACCGGTTCC GGGACTCCTC CGGACGCGTG ATCTACGTGG GCAAGGCCAA GAACCTGCGG 
TCCCGCCTCT CCTCCTACTT CCGCGACTTC GCCGGACTGC ACCCGCGCAC GCAGCAGATG 
GTCTCCACCG CGGCCGACGT CGACTGGACG ATCGTGGGCA CCGAGGTGGA GGCCCTCCAG 
CTGGAGTACT CCTGGATCAA GCAGTACGAC CCCCGGTTCA ACGTCAAGTA CCGCGACGAC 
AAGAGCTACC CCTACCTGGC GGTCACCCTC CAAGAGGAGT TCCCCCGGGT GCAGGTCATG 
CGCGGCGCCA AGCGCAGGGG GGTGCGCTAC TTCGGCCCCT ACTCCCACGC CTGGGCCATC 
CGCGAGACCG TGGACCTGCT GCTGCGGGTC TTCCCCGTGC GCACCTGCTC CCCGGGGGTC 
TTCCGCGGCG CCCGCAACAG CGGCCGCCCC TGCCTGCTCG GCTACATCGG CAAGTGCGTG 
GCCCCCTGCG TGGGCAAGGC CTCGCCCGAG GACCACCGGG CCCTGGCCGA GGACTTCTGC 
TCCTTCCTGG CGGGCGACAC CGGCCGGTTC CTGCGCGAGC TGGAGGGGCG GATGCGCGAG 
GCCGCCGGGG AGATGGAGTA CGAGCGGGCC GCCCGCATCC GCGACGACAT CGAGGCCCTG 
CGCGCCGCCC TGGAGAAGCA GGCCGTCGTC CTGCCCGACT CCACCGACTG CGACGTCATC 
GCCGTGGCCG ACGACCAGTT GGAGGCGGCC GTGCAGATCT TCCACGTGCG CGGCGGGCGC 
ATCCGCGGAC AGCGCGGCTA CGTGGTGGAC AAGGTGGCCG ACGACGGCCC CGGCGAGCTG 
ATCGCGACCT TCCTCGGCCA GATCTACGGT CCCACCCGGG GCGACGACGA GAGCGGGGGC 
ACCGGCACCG CCGTACCCCG CGAGGTCCTG GTCTCCCATG AGCCCGCCGA CCCCGAGGCC 
ATGGCCGCCT GGCTGTCGGA GCACCGCGGC TCCTCGGTGG ACCTGCGGGT GCCGCAGCGG 
GGCGACAAGA AGTCCCTCAT GGAGACCGTC GCCAAGAACG CGGCCGAATC GCTGGCCCGG 
CACAAGACCC ACCGGGCCGG GGACCTGAGC ACCCGCGGCC GCGCCCTCCA GGAGATCCAG 
GAGGCCCTGG AGCTGCCCGA GGCGCCGCTG CGCATCGAGT GCTTCGACAT CTCCAACCTC 
CAGGGCGAGC ACGTGGTGGC GTCCATGGTC GTCTTCGAGG ACGGCCTGGC CCGCAAGTCC 
GAGTACCGCC GCTTCTCCGT CCGCGGCAGC GGCGAGGGCG GCCGGGAACA GCACGACGTC 
GCGGCCATGT ACGAGGTCGT CCACCGGCGC TTCCGGCGCT ACCTGGAGGA GAGCGCCCGC 
AGCGGCGAGG TCGCCCGCAT GGGGGAGACC GGCGACCACG GTGGTCACCA AAGCGACGAC 
GAGCCGTCAC CCGGGAAGTT CGCCTATCCG CCTAACCTGG TGGTGGTGGA CGGCGCCCGG 
CCCCAGGCCG AGGCGGCGCG CCGCGCCCTG GACGAACTCG GGATCGAGGA CGTCGCCGTG 
TGCGGTCTGG CCAAGCGCCT GGAGGAGGTG TGGTTGCCCG GCGACGAGGA CCCGGTGATC 
CTGCCCCGCG CGGGCGAGGG GCTCTACCTG CTCCAGCGGG TGCGCGACGA GGCCCACCGC 
TTCGCCATCC AGTACCACAG GCACAAGCGC GCCAAGGCGC TGACCGGCAG CAGCCTGGAC 
GAGCTGCCCG GTCTGGGGCC GTCCCGCAGG ACGGCCCTGA TCAAGGCGTT CGGCTCGGTG 
CGCAGGCTCG CCTCGGCCAC GGCCGAGGAG ATCGCGGCGG TGCCCGGGAT CGGCCCCAAG 
CTGGCCGAGG CCGTGCACGC ACACCTGTCC GGCGGCCCCG CCACGACGGA GGGGCGGGGC 
GACGGGGCAC CAGCACAGCA CATCACTGAC GGGGGAGGAG ACGCATGA

Protein sequence

MAATPHLRPA PGSIPTDPGV YRFRDSSGRV IYVGKAKNLR SRLSSYFRDF AGLHPRTQQM 
VSTAADVDWT IVGTEVEALQ LEYSWIKQYD PRFNVKYRDD KSYPYLAVTL QEEFPRVQVM 
RGAKRRGVRY FGPYSHAWAI RETVDLLLRV FPVRTCSPGV FRGARNSGRP CLLGYIGKCV 
APCVGKASPE DHRALAEDFC SFLAGDTGRF LRELEGRMRE AAGEMEYERA ARIRDDIEAL 
RAALEKQAVV LPDSTDCDVI AVADDQLEAA VQIFHVRGGR IRGQRGYVVD KVADDGPGEL 
IATFLGQIYG PTRGDDESGG TGTAVPREVL VSHEPADPEA MAAWLSEHRG SSVDLRVPQR 
GDKKSLMETV AKNAAESLAR HKTHRAGDLS TRGRALQEIQ EALELPEAPL RIECFDISNL 
QGEHVVASMV VFEDGLARKS EYRRFSVRGS GEGGREQHDV AAMYEVVHRR FRRYLEESAR 
SGEVARMGET GDHGGHQSDD EPSPGKFAYP PNLVVVDGAR PQAEAARRAL DELGIEDVAV 
CGLAKRLEEV WLPGDEDPVI LPRAGEGLYL LQRVRDEAHR FAIQYHRHKR AKALTGSSLD 
ELPGLGPSRR TALIKAFGSV RRLASATAEE IAAVPGIGPK LAEAVHAHLS GGPATTEGRG 
DGAPAQHITD GGGDA