Gene Ndas_3141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3141
Symbol
ID	9246997
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3757353
End bp	3759140
Gene Length	1788 bp
Protein Length	595 aa
Translation table	11
GC content	76%
IMG OID
Product	DNA polymerase III, epsilon subunit
Protein accession	YP_003681056
Protein GI	297562082
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTACGAC AAGCGGCGCC CGCCGGCGTC CAGACCAGCA TCAGCGACCT CGGTACGCCG 
TTGGCCGCGG CGTCCTTCGT GGTGCTGGAC CTGGAGACCA CCGGCACCAG CGCGAGCGGC 
TCCCGGATCA CGGAGGTCGG CGCGGTCAGG GTGCGCGGCG GCGAGGTCGT CGGCGAGTTC 
GCCACCCTGG TCAATCCCGG TACCCCCATA CCGGCCAACA TCACCCTCCT GACGGGGATC 
ACCCAGTCGA TGGTGGCCTC GGCCCCGCCG ATGGAGGAGG TCCTGCCCCG GCTGCTGGCC 
TTCCTGGACG CCGAGCCCGA CACCGTGCTG GTGGCCCACA ACGCGCCCTT CGACACCGGC 
TTCCTCAAGG CCGCGTGCGA GCGCCACGGC ACGGACTGGC CCGGCTACCC GGTCGTGGAC 
ACGCTGCGCC TGGCCCGCGC CGTGCTCGCG CGCGGCGAGA CGCGCAACCA CCGGCTGGCC 
ACACTGGCGG CCTACTTCGG GGTCCCGGTC GCGCCCAACC ACCGCGCCCT GGAGGACGCC 
CGCGCCACCG TGGGCGTCCT GCACGGGCTC GTGGAGCGCC TGCGCCCCAT GGGCGTGTCC 
AGCGTGGAGG AGCTGCGCGC GGTCACCAAG CCGCCCACCA AGGCCCAGCG CAGCAGGCGC 
CACCTGGCCG AGGACCTGCC GGAGGAGCCG GGCGTGTACG TGTTCACCGA CGCCCGCGGG 
GAGAGCCTCT ACGTCGGCAA GAGCAAGAAC CTGCGCCGCC GGGTGCGCAC CTACTTCACC 
GCGGCCGAGA GCCGCCAGCG CATCCGTGAG ATGGCGGGCC TGGTGGCGGG CGTGACCCCC 
ATCGTGTGCT CCAGCGAGCT GGAGGCCTCC GTCCGCGAGC TGCGCATCAT CGCCGAACGC 
AAACCGCCCT ACAACCGGCG TTCGCGCAAC CCCGAGCGCG CCTCGTGGGT CCGGCTCACC 
GCCGACGCCT TCCCGCGCCT GTCGGTGGTG CGCGCGGTCA GCGGCGACGG GGCGGCCCAC 
ATCGGGCCCT ACGCCTCGCC TCGCGAGGCC GAGCGGGCCA GGGAGGCCCT GCTCCACGTC 
TTCCCGCTGC GCCAGTGCGC GCACACCTTC CGGCCCCCGA AGGCGGTCGC GGGGGGAAGC 
GGAGGCGGGA CCCGCGTCGC CCCGCAGGTG GTCACCTCGG GCGCGCGGTG GACGGGCCCG 
TGCGTGGTGG CACAGCTGGG CCGCTGCGGC GCGCCCTGCG ACGGCAGCGA GAGCGAGGCC 
GAGTACGCCG TGCACGCCGA GGCCGCGCGC GTCGCGATGA CCGGGGACCC CGCCGCCGTG 
GTGGACGCGT ACACCGCGCG CATAGGCGAA CTCGCCGCGG ACCTGCGCTA CGAGGAGGCC 
GCGCACCTGC GCGACCGGCT CACCGCGTTC CTGCGCGGCG CCAGGCGGGC CCAGCGCCTG 
TCGGCCATCG CCGCGGTCGC GCACCTGGTC GCCTCCCGCC GCACCGCCGC GGGCTGGGAG 
ACCTGCGTGG TCCGCCACGG CCGCCTGGCC GCCAGCGCCG TGCTGCGCCC GGGCACCGAC 
CCGGCCGCGT TCCTGGCCTC CCTCGTGGCC ACCGCCGAGT ACGTGCCCGC CGGGTACGGG 
CCCAGCCCCG GCGCGCTCCC GGGGGAGACC GAGCTGGTCC TGGACTGGCT CGCCGACCCC 
GCCACGCGGC TGGTCGAGAT CGACGGGGAG TGGACATGCC CGTTGCGCAG CGCCGAGGCG 
CACACCGGGA TGACACACTG GGCCCATGGC CGCGCTTCCG CTCAATGA

Protein sequence

MVRQAAPAGV QTSISDLGTP LAAASFVVLD LETTGTSASG SRITEVGAVR VRGGEVVGEF 
ATLVNPGTPI PANITLLTGI TQSMVASAPP MEEVLPRLLA FLDAEPDTVL VAHNAPFDTG 
FLKAACERHG TDWPGYPVVD TLRLARAVLA RGETRNHRLA TLAAYFGVPV APNHRALEDA 
RATVGVLHGL VERLRPMGVS SVEELRAVTK PPTKAQRSRR HLAEDLPEEP GVYVFTDARG 
ESLYVGKSKN LRRRVRTYFT AAESRQRIRE MAGLVAGVTP IVCSSELEAS VRELRIIAER 
KPPYNRRSRN PERASWVRLT ADAFPRLSVV RAVSGDGAAH IGPYASPREA ERAREALLHV 
FPLRQCAHTF RPPKAVAGGS GGGTRVAPQV VTSGARWTGP CVVAQLGRCG APCDGSESEA 
EYAVHAEAAR VAMTGDPAAV VDAYTARIGE LAADLRYEEA AHLRDRLTAF LRGARRAQRL 
SAIAAVAHLV ASRRTAAGWE TCVVRHGRLA ASAVLRPGTD PAAFLASLVA TAEYVPAGYG 
PSPGALPGET ELVLDWLADP ATRLVEIDGE WTCPLRSAEA HTGMTHWAHG RASAQ