Gene Ndas_2505 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2505
Symbol
ID	9246355
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2968931
End bp	2970232
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	70%
IMG OID
Product	HNH endonuclease
Protein accession	YP_003680430
Protein GI	297561456
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.561641
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGCAG CGCCCGAGGC GGCCCCCGGG GAATGTTCCC CGGCCGTGGC CGCGCTGGCC 
GGTGCGCGCA AGATCATCCA CCAAGCGTTG AACGCCGAAG TCCCGCCCGG AGCCGATGAG 
ACCGCCGCGG AGGAGATCGC GGCGCTGTGG GCCCAGCTGG ACCAGATCCG CTACCAGGCG 
TTGGCGCAAA TGGCGCGCTT GTACGCGCGC GGTGAGGTCG CCCGCTACAG CGGCTACTCC 
ACGTTGGACA AGTGGATCAC CCACCGCTGT AAGGTCCCCA CTGCCCAGGC CAAGGACCTG 
GCGCGTTTGG CCCAGCACGT GCAGGAGGAG ACGCTGCCCG CCACGGTGGA AGCGGTGGAG 
GAGGGCGCTC TGGCCTTGGG TGAGGCGGTC GCGATCGCCA AAGCCACCGA CAAAGCCGTC 
CAGACCCGCG ATGAGGACCA CTTTCCCGAT GAGGGGGAGT ACCGGCAGGG GTTCGAAGCG 
GCTCTGGTGG CCGCGAAGGC GGAGCGGCCT GCATTGTCGG TCAACCAGCT CCAGTCGGTG 
GCCCGCCAGG TCGCCTACCG TTTGGACCCC CACCGCCTGG ACCGCGACCA CGAGACCGCT 
CACGCCGTCC GCGGGCTGAC GGTGCATGAC ACGTTCCAGG GCAGCTACCA GCTCCAGGCC 
TGGGGCGGCA GTGGGGATGC GTTGATCGTG CGCGCGGCCA TCGACACCTT CACCACCCCA 
CCCTCGGACC AGGACACCCG GTCCCGGTCC CAGCGCGAGC ACGACGCGCT CATCGCGGCG 
CTGCGTTTTG CCACCACCCA CACCGGATGT GACAACGCTC CGGCTCCATT GGCGCAGATC 
CGCATCGTGG TGCCCGTGCA GACCTACCTG GACGCCCAAG GCCAAGAGGT TCCCGCGTTG 
GACGAGCACG GTCGAGTGAT CCCGGTCGGG CTGGTCCACG AACTCGCCGC CGATTCTGAG 
GTGGTGCGGA TGCTCACCGC CCCGCCCACC GGGCAGGTGT TGGATGTGGG CCACAGCCGC 
CGCCTGGCCT CAACCCGCCA ACGCACCGCC GCGTTCCACG GACACGCCAC CTGCGCCCAC 
CCGGGCGGAT GCGAAGTGCC AGTCGCCCTC TGTCAAGCCG ACCACGTCAC CTCGTTCTCC 
CAGGGAGGGC GCACGGTGGT CGCTAACCTG CAACCGCTGT GCGGGCCGCA CAACCGGGCC 
AAGTACCAAC GCGAACTGCG CACACACCGC CAAGGACGGC GGCGGGGACG GGGAGGAGAC 
CACCCGCCCG GCGGGGATCC GGATCCACCG CCCCGGGAAT GA

Protein sequence

MIAAPEAAPG ECSPAVAALA GARKIIHQAL NAEVPPGADE TAAEEIAALW AQLDQIRYQA 
LAQMARLYAR GEVARYSGYS TLDKWITHRC KVPTAQAKDL ARLAQHVQEE TLPATVEAVE 
EGALALGEAV AIAKATDKAV QTRDEDHFPD EGEYRQGFEA ALVAAKAERP ALSVNQLQSV 
ARQVAYRLDP HRLDRDHETA HAVRGLTVHD TFQGSYQLQA WGGSGDALIV RAAIDTFTTP 
PSDQDTRSRS QREHDALIAA LRFATTHTGC DNAPAPLAQI RIVVPVQTYL DAQGQEVPAL 
DEHGRVIPVG LVHELAADSE VVRMLTAPPT GQVLDVGHSR RLASTRQRTA AFHGHATCAH 
PGGCEVPVAL CQADHVTSFS QGGRTVVANL QPLCGPHNRA KYQRELRTHR QGRRRGRGGD 
HPPGGDPDPP PRE