Gene Ndas_3947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3947
Symbol
ID	9247818
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4720763
End bp	4722064
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	70%
IMG OID
Product	HNH endonuclease
Protein accession	YP_003681850
Protein GI	297562876
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGCAG CGCACGAGGC GGCCCCCGGG GAATGTTCCC CGGCCGTGGC CGCTCTGGCC 
GGTGCGCACA AGATCATCCA CCAAGCGTTG AACGCCGAAG TCCCGCCCGG AGCCGACGAG 
GCCGCCGCGG AGGAGATCGC GGCGCTGTGG GCGCAGCTGG ACCAGATCCG CTATCAGGCG 
TTGGCACAGA TGGCGCGCCT GTACGCACGT GGTGAGGTCG CCCGCTACAG CGGCTACTCC 
ACGTTGGACA AGTGGATCAC CCACCGCTGC AAGGTCCCCG CCGCTCAGGC CAAGGATTTG 
GCTCGTTTGG CCCAGCACGT GCAGGAGGAG ACGCTGCCCG CCACGGTGGA AGCGGTGGAG 
GAGGGCGCTC TGGCTTTGGG TGAGGCGGTC GCGATCGCCA AAGCCACTGA CAAGGCCGTC 
CAGACCCGCG ACGCCCAACA TTTCCCCGAT CAGGGGGAGT ATCGGCAGGG GTTCGAAGCG 
GCGCTGGTGG CCGCGAAGGC GGAGCGGCCC GCGTTGTCGG TCAACCAGCT CCAGTCGGTG 
GCCCGCCAGG TCGCCTACCG TTTGGACCGC CACCGCCTGG ACCGCGACCA CGAAGCCGCT 
CACGCCGCCC GTGGACTGAC GGTCCATGAC ACGTTCCAGG GCAGCTACCA GCTCCAGGCC 
TGGGGCGGCA GTGGGGATGC GTTGGTCGTG CGCGCGGCCA TCGACACCTT CACCACCCCA 
CCCTCGGACC AGGACACCCG GTCCCGGTCC CAGCGCGAGC ACGACGCGCT CATCGCGGCG 
CTGCGTTTCG CCACCACCCA CACCGGATGC GCCAACGCTC CGGCTCCGTT GGCACAGATC 
CGCATCGTGG TGCCCGTGCA GACCTACCTG GACGCCCAAG GCCAAGAGGT TCCCGCGTTG 
GACGAGCACG GTCGAGTGAT TCCGGTCGGG CTGGTCCACG AGTTGGCCGC CGATTCCGAG 
GTGGTGCGGA TGCTCACCGC ACCGCCCACC GGACAGGTGC TGGATGTGGG CCACAGCCGC 
CGCCTGGCCT CAACCCGCCA ACGCACCGCC GCCTTCCACG GACACGCCAC CTGCGCCCAC 
CCGGGCGGAT GCGAAGTGCC AGTCGCCCTC TGCCAAGCCG ACCACGTGCA GTCGTTCTCC 
CGAGGCGGAC GCACCGTGGT CGCCAACCTC CAACCTCTGT GCGGGCCGCA CAACCGGGCC 
AAGTACCAAC GCGAACTGCG CACACACCAC CAAGGACAGC GGCGGGAACG GGGAGGAGAC 
CACCCACCCG GCGGGGAGCC GGATCCACCA CCCCGGGAAT GA

Protein sequence

MIAAHEAAPG ECSPAVAALA GAHKIIHQAL NAEVPPGADE AAAEEIAALW AQLDQIRYQA 
LAQMARLYAR GEVARYSGYS TLDKWITHRC KVPAAQAKDL ARLAQHVQEE TLPATVEAVE 
EGALALGEAV AIAKATDKAV QTRDAQHFPD QGEYRQGFEA ALVAAKAERP ALSVNQLQSV 
ARQVAYRLDR HRLDRDHEAA HAARGLTVHD TFQGSYQLQA WGGSGDALVV RAAIDTFTTP 
PSDQDTRSRS QREHDALIAA LRFATTHTGC ANAPAPLAQI RIVVPVQTYL DAQGQEVPAL 
DEHGRVIPVG LVHELAADSE VVRMLTAPPT GQVLDVGHSR RLASTRQRTA AFHGHATCAH 
PGGCEVPVAL CQADHVQSFS RGGRTVVANL QPLCGPHNRA KYQRELRTHH QGQRRERGGD 
HPPGGEPDPP PRE