Gene Ndas_4589 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4589
Symbol
ID	9248470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5440332
End bp	5441618
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	69%
IMG OID
Product	HNH endonuclease
Protein accession	YP_003682482
Protein GI	297563508
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGCAG CGCACGAGGC GGCCCCCGGG GAATGTTCCC CGGCCGTGGC CGCGCTGGCC 
GGTGCGCGCG AGATCATCCA CCAGGCGTTG AACGCCGAAG TGCCGCCCGG GGCCGATGAG 
GCCGCCGCTG AGGAGATCGC GGCGCTGTGG GCGCAGCTGG ATCAGATCCG GTATCAGGCG 
TTGGCGCAGA TGGCGCGCCT GTACGCGCGC GGTGAGGTCG CCCGCTACAG CGGCTACTCC 
ACGCTGGACA AGTGGTTGGT GCACCACGGC ACGATGCCCA CCGCTCAGGC CAAGGATTTG 
GCTCGTTTGG CCCAGCACGT GCAGGAGGAG ACGCTGCCCG CCACTGCCCA AGCAGTAGCT 
GAGGGCAGGG TGGTGTTGGG TGAGGCGGTG GCGATCGCCA AGGCCACCGA CAAAGCCGTC 
CAGACCCGCG ATGAGGACCA CTTTCCCGAT GAGGGGGAGT ACCGGCACGG GTTTGAGTCC 
GCCCTGGTGG CCGCGAAGGC GGAGCGGCCT GCGTTGTCGG TCAACCAGCT CCAGTCGGTG 
GCCCGCCAGG TCGCCTACCG TTTGGACCCC CACCGCCTGG ACCGCGACCA CGAAGCTGCT 
CACGCGGCCC GCGGGCTGAC GGTGCATGAC ACGTTCCAGG GCAGCTACCA GCTCCAGGCC 
TGGGGTGGGT CTGGGGATGC GTTGATCGTG CGCGCGGCCA TCGACACCTT CACCACCCCA 
TCCGGGGAAG GTGACACCCG GTCCCGGTCC CAGCGTGAGC ACGACGCGCT CATCGCGGCG 
CTGCGTTTCG CCACCACCCA CACCGGATGC GCCAACGCTC CGGCTCCATT GGCGCAGATC 
CGCATCGTGG TGCCCGTGCA GACCTACCTG GACGCCCAAG GCCAGGAGGT TCCGGCGTTG 
GACGAGCACG GTCGAGTGAT TCCGGTCGGG CTGGTCCACG AACTCGCCGC CGATTCCGAG 
GTGGTGCGGA TGCTCACCGC ACCCCCCACC GGACAGGTGC TGGATGTGGG CCACAGCCGC 
CGCCTGGCCT CAACCCGCCA ACGCACCGCC GCCTTCCACG GACACGCCAC CTGCGCCCAC 
CCGGGCGGAT GTGAGGTACC GGTGGCGTTG TGCCAAGCCG ACCACGTGCA GTCGTTCTCC 
CGAGGAGGGC GCACGGTGGT CGCCAACCTC CAACCGCTGT GCGGGCCGCA CAACCGGGCC 
AAGTACCAAC GCGAACTGCG CACACACCGA CAGCAGGAAC GGCACCATCC GCCCGACAGG 
ATTCCGGTTC CCCCACCCCG AAAATGA

Protein sequence

MIAAHEAAPG ECSPAVAALA GAREIIHQAL NAEVPPGADE AAAEEIAALW AQLDQIRYQA 
LAQMARLYAR GEVARYSGYS TLDKWLVHHG TMPTAQAKDL ARLAQHVQEE TLPATAQAVA 
EGRVVLGEAV AIAKATDKAV QTRDEDHFPD EGEYRHGFES ALVAAKAERP ALSVNQLQSV 
ARQVAYRLDP HRLDRDHEAA HAARGLTVHD TFQGSYQLQA WGGSGDALIV RAAIDTFTTP 
SGEGDTRSRS QREHDALIAA LRFATTHTGC ANAPAPLAQI RIVVPVQTYL DAQGQEVPAL 
DEHGRVIPVG LVHELAADSE VVRMLTAPPT GQVLDVGHSR RLASTRQRTA AFHGHATCAH 
PGGCEVPVAL CQADHVQSFS RGGRTVVANL QPLCGPHNRA KYQRELRTHR QQERHHPPDR 
IPVPPPRK