Gene Ndas_1508 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1508
Symbol
ID	9245358
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1847819
End bp	1849129
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	69%
IMG OID
Product	HNH endonuclease
Protein accession	YP_003679444
Protein GI	297560470
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000388947
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00249472
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGAGATGA CGACCGCAGC GCCCGAGGCG GACCCCGGGG AATGTTCCCC GGCCGTGGCC 
GCGCTGGCCG GTGCGCGCGA GATCATCCAC CAGGCGTTGA ACGCCGAGGT GCCACCCGGG 
GCCGACGAGG CCGCCGCTGA GGAGATCGCG GCGCTGTGGG CTCAGCTGGA CCAGATCCGG 
TATCAGGCGT TGGCACAGAT GGCGCGTTTG TACGCACGTG GTGAGGTCGC CCGCTACAGC 
GGCTACTCCA CGCTGGACAA GTGGATCACC CACCACTGCA AGGTCCCCAC CGCTCAGGCC 
AAGGACCTGG CTCGTTTGGC CCAGCACGTG CAGGAGGAGA CACTGCCCGC CACTGCCCAA 
GCAGTAGCTG AGGGCAGGGT GGTGTTGGGT GAGGCGGTCG CGATCGCCAA GGCCACTGAC 
AAGGCCGTCC AGACCCGCGA TGAGGACCGC TTTCCCGATG AGGTGGAGTA TCGGCACGGG 
TTTGAGTCCG CCCTGGTGGC CGCGAAGGCG GAGCGGCCCG CGTTGTCGGT CAACCAGCTC 
CAGTCGGTGG CCCGCCAGGT CGCCTACCGT TTGGACCCCC ACCGCCTGGA CCGCGACCAC 
GAGGCCGCCC ATGCCGTCCG CGGGCTGACG GTGCATGACA CGTTCCAGGG CAGCTACCAA 
CTCCAGGCCT GGGGTGGGTC TGGGGATGCG TTGATCGTGC GCGCGGCCAT CGACACCTTC 
GACGTTTCGC ACTCGGATGA GGACACCCGG TCCCGGTCCC AGCGCGAGCA TGACGCGCTC 
ATCGCGGCGC TGCGTTTTGC CACCACCCAC ACCGGATGCG CCAACGCTCC GGCTCCATTG 
GCGCAGATCC GCATCGTCGT GCCCGTGCAG ACCTACCTGG ACGCCCAAGG CCAAGAGGTT 
CCCGCGTTGG ACGAGCACGG TCGGGTGATC CCAGCCGGTG TGGTCCACGA ACTGGCCGCC 
GATTCTGAGG TGGTGCGGAT GCTCACCGCA CCCCCCACCG GACAGGTGCT GGACGTGGGC 
CACAGCCGCC GCCTGGCCTC AACCCGCCAA CGCACCGCCG CCTTCCACGG ACACGCCACC 
TGCGCCCACC CGGGCGGATG CGAAGTGCCA GTCGCCCTCT GCCAAGCCGA CCACGTGCAG 
TCGTTCTCCC GAGGCGGACG CACCGTGGTC GCCAATCTCC AACCGTTGTG CGGGCCGCAC 
AACCGGGCCA AGTACCAACG CGAACTGCGC ACACACCACC AAGGACGGCG GCGGGGACGG 
GGAGGAGACC ACCCACCCGG CGGGGAGCCG GATCCACCAC CCCGGGAATG A

Protein sequence

MEMTTAAPEA DPGECSPAVA ALAGAREIIH QALNAEVPPG ADEAAAEEIA ALWAQLDQIR 
YQALAQMARL YARGEVARYS GYSTLDKWIT HHCKVPTAQA KDLARLAQHV QEETLPATAQ 
AVAEGRVVLG EAVAIAKATD KAVQTRDEDR FPDEVEYRHG FESALVAAKA ERPALSVNQL 
QSVARQVAYR LDPHRLDRDH EAAHAVRGLT VHDTFQGSYQ LQAWGGSGDA LIVRAAIDTF 
DVSHSDEDTR SRSQREHDAL IAALRFATTH TGCANAPAPL AQIRIVVPVQ TYLDAQGQEV 
PALDEHGRVI PAGVVHELAA DSEVVRMLTA PPTGQVLDVG HSRRLASTRQ RTAAFHGHAT 
CAHPGGCEVP VALCQADHVQ SFSRGGRTVV ANLQPLCGPH NRAKYQRELR THHQGRRRGR 
GGDHPPGGEP DPPPRE