Gene Namu_2079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2079
Symbol
ID	8447689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	2291364
End bp	2292968
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	69%
IMG OID	645041201
Product	IstA2
Protein accession	YP_003201446
Protein GI	258652290
COG category	[L] Replication, recombination and repair
COG ID	[COG4584] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0246359
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00457727
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGGTCGA GGGTGGGGTT GTTCGCTGTC ATCCGGCGCG ACGCCCGGGT CGAGGGATTG 
TCGATCCGCG AGCTCGCTGA TCGGCATCAC GTGCACCGCA GAACCGTTCG GCAGGCGATG 
GCCAGTGCGT TACCGCCGCC GCGGAAGACA CCGGTGCGGG TCTCCCGGAA GCTCGAACCG 
TTCAAGGTCA CGATCGACGA CTGGCTGCGG GCGGACCTGG ACGCGCCGAG GAAGCAACGC 
CACACCGCGA AGCGGGTGCT GGACCGGCTC CTCGACGAAC ACGGCGCCGC CGATGTGTCG 
TACTCGACGG TGCGGGATTA CGTCGCCCGG CGACGCCCGG AGATCGCCGC CGCGGCCGGC 
CGGACCTTGT CGCAGGGTTT CGTCCCGCAG ACCCATGAGC CGGGTGGTGA GGCCGAGGTC 
GACTTTGCCG ATCTGTGGGT CGTGCTGCGC GGGGTGAAGA CCAAGACGTT CCTGTTCACC 
CTGCGCCTGT CGTATTCCGG GAAGGCGGTG CACCGGGCGT TCGCCACCCA GGGCCAGGAG 
GCGTTCCTGG AAGGTCATGT GCACGCGTTC ACCGAACTGG GCGGCACCCC GATCGACAAG 
ATCCGCTACG ACAACCTCAA AGCCGCGGTG TCCCGGGTGC TGTTCGGTCG TGGCCGGGAG 
GAATCCGGCC GGTGGGTGGC GTTCCGATCC CATTTCGGGT TCGATGCGTT CTACTGCCAC 
CCCGGGCAGG AAGGTGCCCA CGAGAAGGGC GGCGTCGAAG GCGAGGGCGG CCGGTTCCGC 
CGCAACCACT GCGTCCCGAT GCCGGTCGTG GACTCCATCG AGCAGCTCAA TGAGCTGCTC 
GTCGCGGCGG ACGCGAAGGA TAACTACCGG CGGATCGCGA GCCGCACCAA CACCGTCGCC 
CAGGACTGGG CGTTCGAACG GGACACGCTG CGGCCGTTGC CGTCCGAGGT GTTCCCGACC 
TGGCTGACTC TGACCCCCAG GGTTGACCGG TATGCCCGGG TGACCGTCCG GCAACGGCAC 
TACTCGGTGC CGGCCCGGTT CATCGGCCGC CGGGTCCGGG TGCAGCTCGG CGCTTCATCG 
GTGACCGCGT TCGACGGTCG CACCGTCATC GCCACCCATG AACGGGTCAT GCTCAAGGGC 
GGCCAGTCCC TGGTCCTGGA CCACTACCTC GAGGTGCTGC AACGCAAACC CGGCGCACTG 
CCCAACGCGA CCGCGTTGGT GCAGGCCCGC GCGTCCGGAA TGTTCACCGC GGCGCATGAG 
GCGTTCTGGG CCGCCGCCCG CAAGGCTCAT GGTGACTCCG GCGGCACCCG AGCGTTGATC 
GAGGTGCTGC TGCTGCACCG GCACCTGGCC GCCTCCGATG TGATCGCGGG GATCACCGCC 
GCTCTCACGG TGGGCTCGGT CAGCCCGGAC GTCGTCGCTG TCCAGGCCCG CAAAACCGCG 
CACCAGTGCA GCGCAGACGC AGTGATCGCA TCACCGAACA CCACACCGGC CGGGGATCGG 
GTGGTCAGCC TGACCGAGCG GCGCCTGGCG GAGCTGCCCG CCGACTCGCG CCCGTTGCCG 
TCGGTGTCGC AGTACGACGA GCTGCTGACC AGGGAATCGT CATGA

Protein sequence

MGSRVGLFAV IRRDARVEGL SIRELADRHH VHRRTVRQAM ASALPPPRKT PVRVSRKLEP 
FKVTIDDWLR ADLDAPRKQR HTAKRVLDRL LDEHGAADVS YSTVRDYVAR RRPEIAAAAG 
RTLSQGFVPQ THEPGGEAEV DFADLWVVLR GVKTKTFLFT LRLSYSGKAV HRAFATQGQE 
AFLEGHVHAF TELGGTPIDK IRYDNLKAAV SRVLFGRGRE ESGRWVAFRS HFGFDAFYCH 
PGQEGAHEKG GVEGEGGRFR RNHCVPMPVV DSIEQLNELL VAADAKDNYR RIASRTNTVA 
QDWAFERDTL RPLPSEVFPT WLTLTPRVDR YARVTVRQRH YSVPARFIGR RVRVQLGASS 
VTAFDGRTVI ATHERVMLKG GQSLVLDHYL EVLQRKPGAL PNATALVQAR ASGMFTAAHE 
AFWAAARKAH GDSGGTRALI EVLLLHRHLA ASDVIAGITA ALTVGSVSPD VVAVQARKTA 
HQCSADAVIA SPNTTPAGDR VVSLTERRLA ELPADSRPLP SVSQYDELLT RESS