Gene Ndas_2460 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2460
Symbol
ID	9246310
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2918783
End bp	2920069
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	68%
IMG OID
Product	HNH endonuclease
Protein accession	YP_003680386
Protein GI	297561412
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGCAG CACCCAAAGT GGCCCCCGGG GAATGTTCCC CGGCCGTGGC CGCGCTGGCC 
GGTGCGCGCG AGATCATCCA CCAAGCGTTG AACGCCGAAG TCCCGCCCGG GGCCGACGAG 
ACCGCCGCGG AGGAGATCGC GGCGCTGTGG GCGCAGCTGG ACCAGATCCG GTATCAGGCG 
TTGACGCAGA TGGCGCGCCT GTACGCACGT GGTGAGGTCG CCCGTTACAG CGGCTACAGC 
ACGTTGGACA AGTGGATCAC CCATCGCTGC AAGGTCCCCA CTGCCCAGGC CAAGGATTTG 
GCCCGTTTGG CCCAGCACGT GCAGGAGGAG ACGTTGCCCG CCACTGCCCA AGCAGTAGCT 
GAGGGCAGGG TGGTGTTGGG TGAGGCGGTC GCGATCGCCA AAGCCACCGA CAAAGCCGTC 
CAGACCCGCG ATGAGGACCA CTTTCCCGAT GAGGGGGAGT ACCGGCAGGG GTTCGAAGCG 
GCTCTGGTGG CCGCCAAGGC GGAGCGGCCC GCGTTGTCGG TCAACCAGCT CCAGTCGGTG 
GCCCGCCAGG TCGCCTACCG TTTGGACCCC CACCGCCTGG ACCGCGACCA CGAGACCGCC 
CATGCCGCCC GTGGACTGAC GGTCCATGAC ACGTTCCAGG GCAGCTACCA ACTCCAGGCC 
TGGGGCGGGT CTGGGGATGC GTTGGTCGTG CGCGCGGCCA TCGACACCTT CGACGTTTCG 
CACTCGGATG AGGACACGCG CAGTCGTTCG CAGCGTGAGC ACGACGCGCT CATCGCGGCG 
CTGCGTTTTG CCACCACCCA CACCGGATGC GGCAACGCTC CGGCTCCGTT GGCGCAGATC 
CGCATCGTGG TGCCCGTGCA GACCTATCTG GACGCCCAAG GCCAGGAGGT TCCGGCGTTG 
GACGAGCACG GTCGGGTGAT CCCGGTCGGG CTGGTGCACG AGTTGGCCGC CGATTCTGAG 
GTGGTGCGGA TGCTCACCGC ACCGCCCACC GGGCAGGTGT TGGATGTGGG CCACAGCCGC 
CGCCTGGCCT CAACCCGCCA ACGCACCGCC GCTTTCCACG GACACGCCAC CTGCGCGCAC 
CCGGGCGGAT GTGAGGTACC GGTGGCGTTG TGCCAGGCCG ACCACGTCAC CTCGTTCTCC 
CGGGGCGGGC GCACGGTGGT CGCCAACCTG CAACCGTTGT GCGGGCCGCA CAACCGGGCC 
AAGTACCAAC GCGAACTGCG CACACACCGA CAGCGGGAAC GGCATCATCC GCCCGACAGG 
ATTCCGGTTC CACCGCCCCG GGAATGA

Protein sequence

MIAAPKVAPG ECSPAVAALA GAREIIHQAL NAEVPPGADE TAAEEIAALW AQLDQIRYQA 
LTQMARLYAR GEVARYSGYS TLDKWITHRC KVPTAQAKDL ARLAQHVQEE TLPATAQAVA 
EGRVVLGEAV AIAKATDKAV QTRDEDHFPD EGEYRQGFEA ALVAAKAERP ALSVNQLQSV 
ARQVAYRLDP HRLDRDHETA HAARGLTVHD TFQGSYQLQA WGGSGDALVV RAAIDTFDVS 
HSDEDTRSRS QREHDALIAA LRFATTHTGC GNAPAPLAQI RIVVPVQTYL DAQGQEVPAL 
DEHGRVIPVG LVHELAADSE VVRMLTAPPT GQVLDVGHSR RLASTRQRTA AFHGHATCAH 
PGGCEVPVAL CQADHVTSFS RGGRTVVANL QPLCGPHNRA KYQRELRTHR QRERHHPPDR 
IPVPPPRE