Gene Ndas_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0020
Symbol
ID	9243847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	24238
End bp	25896
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	68%
IMG OID
Product	Catalase
Protein accession	YP_003677978
Protein GI	297559004
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0935072
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACG TATCCAGCCA GGGATCCGCG CCGGGAGACG ACCGCGAGGT GCTCACGAAC 
CGGCAGGGAC ACCCGGTCTA CGACAACCAG AACCAGCGCA CGGTCGGCGA GCGGGGGCCC 
GCGACGCTGG AGAACTACCA GTTCCTGGAG AAGATCAGCC ACTTCGACCG GGAGCGCATC 
CCGGAGCGGG TGGTGCACGC GCGCGGGGTG ACCGCGTTCG GCTACTTCGA GTCCTACGGC 
GCGTGGGGCG ACGAGCCGAT CAGCCGCTAC ACGCGGGCCA AGCTCTTCCA GGGCAGGGGC 
AAGCGGACCG ACATCGCGCT GCGCTTCTCG ACCGTCATCG GCGGCAGGGA CTCCTCGGAG 
TGCGCGCGCG ACCCGCGCGG GTTCGCGATC AAGTTCTACA CCGAGGACGG CAACTGGGAC 
CTGGTGGGCA ACAACCTCGC GGTGTTCTTC ATCCGCGACG CCATCAAGTT CCCCGACGTG 
ATCCACGCCC TCAAGCCGGA CCCGGTGACC TTCCGCCAGG AGCCCAACCG CATCTTCGAC 
TTCATGTCGC AGACCCCCGA GTGCATGCAC ATGCTGGTCA ACCTGTTCAG CCCGCGCGGC 
ATCCCGGCGG ACTACCGGCA CCAGCAGGGC TTCGGCGTCA ACACCTACAA GTGGGTCAAC 
GACGTGGGCG AGACCGTCCT GGTCAAGTAC ACCTGGATGC CCAAGCAGGG CGTGCGCAGC 
ATGACCGAGG CCGACGCCGC CAACCTCCAG GCGGACGAGA CCGGGCACGC GACCAAGGAC 
CTGCACGAGG CCATCGACCG CGGCGATTAC CCGGAGTGGG AGCTGCTCGT GCAGATGATG 
AGCGACGAGG AGCACCCCGA GCTCGACTTC GACCCGCTGG ACGACACCAA GACCTGGCCG 
GAGCAGGACT TCCCGCCCAA GGCGGTGGGG CGGATCGTGC TCGACCGGAA CGTGTCGGAC 
AACTTCGCGG AGAACGAGCA GATCTCCTTC GGCACCGGCG TGCTCGTGGA CGGCCTGGAC 
TTCTCCGACG ACAAGATGCT CGTCGGGCGC ACCTTCTCCT ACAGCGACAC GCAGCGCTAC 
CGGGTGGGGC CCAACTACCT CCAGCTGCCG GTGAACCAGG CCAAGAACGC CGACGTGCGC 
ACCAACCAGC GCGACGGCCT GATGGCCTAC CACCAGGACT CCGGGGGCGA GAACCCGCAC 
GTCAACTACG AGCCGTCCAT CAACGGCGGC CTGCGCGAGG GGCAGTACCC CACGCACGAC 
GAGCAGGGGC CGGAGATCCG GGGGCGGATG ACGCGCAAGC GCATCTCCCG CACCAACGAC 
TACCAGCAGG CGGGGCAGCG GTACACGCTG ATGGAGGAGT GGGAGCGCGA CGACCTGGTG 
CGCAACTTCA TCGGACAGCT CTCCCAGTGC GACCGGCCGA TCCAGGAGAG GATGGTCTGG 
CACTTCCTCA TGGTCGACGA CGACCTGGGG CTGCGCGTCG GCGAGGGGCT GGGCATCGGC 
CCGGGCGACG TGGCGCACCT GGAGCCGCTG CGGAGCCAGA CCCTGGACGA GGGGGAGCGC 
CAGCGCATGG CCAACCTGGG CAAGAACGGC CCCCGGGACG TGTCGGGGCT GACGATGACC 
CACTGCGTGC CCAACCAGCG GCACGTGGTG GAGCGCTGA

Protein sequence

MTDVSSQGSA PGDDREVLTN RQGHPVYDNQ NQRTVGERGP ATLENYQFLE KISHFDRERI 
PERVVHARGV TAFGYFESYG AWGDEPISRY TRAKLFQGRG KRTDIALRFS TVIGGRDSSE 
CARDPRGFAI KFYTEDGNWD LVGNNLAVFF IRDAIKFPDV IHALKPDPVT FRQEPNRIFD 
FMSQTPECMH MLVNLFSPRG IPADYRHQQG FGVNTYKWVN DVGETVLVKY TWMPKQGVRS 
MTEADAANLQ ADETGHATKD LHEAIDRGDY PEWELLVQMM SDEEHPELDF DPLDDTKTWP 
EQDFPPKAVG RIVLDRNVSD NFAENEQISF GTGVLVDGLD FSDDKMLVGR TFSYSDTQRY 
RVGPNYLQLP VNQAKNADVR TNQRDGLMAY HQDSGGENPH VNYEPSINGG LREGQYPTHD 
EQGPEIRGRM TRKRISRTND YQQAGQRYTL MEEWERDDLV RNFIGQLSQC DRPIQERMVW 
HFLMVDDDLG LRVGEGLGIG PGDVAHLEPL RSQTLDEGER QRMANLGKNG PRDVSGLTMT 
HCVPNQRHVV ER