Gene Ndas_0002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0002
Symbol
ID	9243828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	3397
End bp	4536
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	71%
IMG OID
Product	DNA polymerase III, beta subunit
Protein accession	YP_003677961
Protein GI	297558987
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000269969
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00612818
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAAGTTCC GGGTCGAACG CGACGTACTG GCCGAGGCGG TCGCCTGGAC CGCGCGCACA 
CTCCCGACGC GCCCCTCGGT GCCGGTGCTC GTCGGCATCC TGCTGGAGGC CGGTGAGTTC 
GACGGCCTCC AGCAGCTGCG CCTGTCCGGC TTCGACTACG AGGTCTCCAC CCAGGCCGCG 
GTGGACGTCG AGGTCGAGGA GCCGGGCACG GTCCTGGTCA CCGGTAAGCT CCTGGCCGAG 
ATCACCCGCA ACCTCCCCGC GCAGCCCGTG GAGATCTCCA CCGACGGCGC CAAGGTCGTC 
GTCACCGGCG GCAGCGCGAA GTTCACCCTG ACCACCATGC CGGTGGAGGA CTACCCCACG 
CTCCCGGAGA TGCCCGGTGT GAGCGGGACC GTCGGCAGCG ACGCCTTCGC CGCCGCGGTC 
AGCCAGGTGG CCGTGGCCGC CGGGCGCGAC GACACCCTGC CGATGCTCAC CGGCGTGCGC 
GTCGAGATCG AGGGCGAGAC CATCACGCTC GCCTCCACCG ACCGCTACCG CCTGGCCGTG 
CGCGAGTTCA CCTGGAAGCC GGAGAACCCC GACCTGTCCG CGGTCGCGCT GGTCCCGGCC 
AAGACCCTCC ACGACACCGC CAAGTCGCTC ACCTCGGGCG CCGAGGTCTC GATCGCCCTC 
TCGGACGGCG GCTCCGGCGA GGGCATGATC GGCTTCGAGG GCGGCGGCCG CCGCACCACG 
ACCCGCCTGC TCGACGGCGA GTTCCCCAAG TACCGGGCGC TGCTGCCGGA CACCTTCAAC 
TCGGTGGCCG AGGTCAGCCG CTCCGAGTTC GTCGAGGCGG TCAAGCGCGT CTCGCTGGTC 
GCCGAACGCA ACACCCCGCT GCGGCTGTCC TTCAGCCAGG GCCAGCTGGT CCTGGAGGCG 
GGCACCGGCG AGGAGGCGCA GGCGGTCGAG GTCCTGGAGG CCGACCTGGA CGGCGACGAC 
ATCCAGATCG CCTTCAACTC CGGGTTCCTC CTGGACGGGC TCGGCGCCAT CGGCACCGAC 
GTGGCCCGCC TGCACTTCAC CACCTCGACC AAGCCGTCGA TCCTGACCGG CAAGCCCGCG 
GAGGAGGGTT CCTCCCCCGA GTACCGCTAC CTGATCATGC CGGTGCGTCA GCCGGGCTGA

Protein sequence

MKFRVERDVL AEAVAWTART LPTRPSVPVL VGILLEAGEF DGLQQLRLSG FDYEVSTQAA 
VDVEVEEPGT VLVTGKLLAE ITRNLPAQPV EISTDGAKVV VTGGSAKFTL TTMPVEDYPT 
LPEMPGVSGT VGSDAFAAAV SQVAVAAGRD DTLPMLTGVR VEIEGETITL ASTDRYRLAV 
REFTWKPENP DLSAVALVPA KTLHDTAKSL TSGAEVSIAL SDGGSGEGMI GFEGGGRRTT 
TRLLDGEFPK YRALLPDTFN SVAEVSRSEF VEAVKRVSLV AERNTPLRLS FSQGQLVLEA 
GTGEEAQAVE VLEADLDGDD IQIAFNSGFL LDGLGAIGTD VARLHFTTST KPSILTGKPA 
EEGSSPEYRY LIMPVRQPG