Gene Namu_3157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3157
Symbol
ID	8448771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3479268
End bp	3480593
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	73%
IMG OID	645042238
Product	HNH endonuclease
Protein accession	YP_003202479
Protein GI	258653323
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.000184807
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000205863
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGGACC TGGCGGGCGA GCTGACGGAC GCGGACATGC TGGCGATGTG GGCAAACGCT 
CCGATCAACC CTCAACCTCT AGTTGAGAGT GATCCCCCGG ATGAGGCGTT GGCCGAGCTG 
GAGAGCCGGA TCACCTCGAT GGCGGCACGG TTGGCCGCGC AGACCCGGGA GTGGCTGGCC 
CTGGTCGCCG AGTTCAACCG GCGCAAGGGG TGGGTGCAGT GGGGGATGCG GTCGATGGCG 
CACTGGCTGT CCTGGTCATG TTCGGTCGGG CCGGGGGTGG CCCGGGAGTA CGTGCGGGTC 
GCGACCGCGC TGACCGAGTT GCCGCTGGTG GACGAGGCGT TCGCGCAGGG GCAGCTGTCG 
TATTCCAAGG TGCGGGCGGT GACCCGGGTC GCCGACCAGG TGGACCAGAC CACGCTGCTG 
GAGCAGGCCA AGGTGCATTC CGCGGCCCAG CTGGAGAAGG TGATCCGCGG CTACCGCAAG 
GCGCAGCGGC CGGACCGGCC GGTCGAGCAG CGCCGCAAGG CGCGCTGGTT CTACGACGAG 
GACGGGATGC TGGTGCTGTC CGCGCGGTTG ACCGCGGACG AGGGGGCGTT GCTGGTCGCC 
GCGCTGGAGC AGGCCCGGGG CACCGGGCTG GGCAAGGACG ATCCGCTGCC CGGCGACGCC 
GACGCGCTGG TCGCGCTGGC GCAGACCGCG CAGGCCGCTG GCGCGGTGGA CTCCTCGGGG 
GACGACCGGC ACCTGGTGGT GGTGCACGCC GACGCCGACG TGCTGATCGG CGCCGACCAG 
TCGCCCGATG CGATCTGCCG GATCGAGCAC GGCCCCGGCC TGACCGCCGA CGCGGCCCGC 
CGGCTGGCCT GTGACGCGGC GCTGATCGCC TGGGTGTCCT CGGCGGTCTC GCCGGGCAAG 
AACCTGCGGC TGGGCCGCAA GACCCGCAAG ATCCCGCCGG CGCTGCGCCG GGCGTTGCGG 
CTGCGCGACG GCGGCTGCCG GTTTCCCGGC TGCCCGCGGA TGCGGTTCCT GGACGCACAC 
CACGTTATCC ACTGGGCCGA CGGAGGCCCG ACGGATCTGG AGAACCTGAT CCTGCTGTGC 
GGGCGGCACC ACCGGTCGAT GCACGAGGAG GGATTCACCC TGGTCCAGGA TGGGCCACAA 
CGCTGGTCGG TCCGCCGGCC CGACGGGACC ACGATCCCCG CCGCGCCGCC CCTGCCCCTG 
ACGCCGCCCC CGGACGTTCC CGCGGAAACG GAGTACGACC CGGACGCCCT GCGTCCCGAC 
CAGCACGGCG AGCCGTTCAG CCTGCGCGAC TCGGTCGACG TGTTCTGCCG GAACCCGCGG 
CCATGA

Protein sequence

MTDLAGELTD ADMLAMWANA PINPQPLVES DPPDEALAEL ESRITSMAAR LAAQTREWLA 
LVAEFNRRKG WVQWGMRSMA HWLSWSCSVG PGVAREYVRV ATALTELPLV DEAFAQGQLS 
YSKVRAVTRV ADQVDQTTLL EQAKVHSAAQ LEKVIRGYRK AQRPDRPVEQ RRKARWFYDE 
DGMLVLSARL TADEGALLVA ALEQARGTGL GKDDPLPGDA DALVALAQTA QAAGAVDSSG 
DDRHLVVVHA DADVLIGADQ SPDAICRIEH GPGLTADAAR RLACDAALIA WVSSAVSPGK 
NLRLGRKTRK IPPALRRALR LRDGGCRFPG CPRMRFLDAH HVIHWADGGP TDLENLILLC 
GRHHRSMHEE GFTLVQDGPQ RWSVRRPDGT TIPAAPPLPL TPPPDVPAET EYDPDALRPD 
QHGEPFSLRD SVDVFCRNPR P