Gene Namu_2061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2061
Symbol
ID	8447671
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	2274988
End bp	2276385
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	71%
IMG OID	645041185
Product	transposase IS4 family protein
Protein accession	YP_003201430
Protein GI	258652274
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000000000689755
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00689759
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGGAAGT CTACCGGGCT GTACCCGTCG CTCCGAGTCG ATGCCACCGG CAAGCGGGTG 
GTGTCCCACG GCGGGTCGGT GCTGCTGGCC TTGGCCGCGG ACAGGGTCGG TTTGGGTCGT 
GGGTTGTCGG CGGCGTTGAG GCCGTGGCGC AAGCCGATGG CGGTGCACGA CCCGGGCAAG 
ATCCTGCTCG ACCTGGCGAT CTCGCTGGCG ATCGGCGGTG ACTGCCTGGC CGACATCGCC 
CAACTGCGGG CCGAGCCCGC CGTGTTCGGT CATGTGGCGT CCGACCCGAC TGTGTCCCGG 
CTGATCGACA CCCTCGCCCC GGACGCGACG GCAGCGCTGA AGGCGATCGA CACCGCGCGG 
GCGGCAGCCC GCGCCCGGGC GTGGAAGCTG GCCGGACCCG CCGCACCGAA CCATGACCGG 
TCGGCGAAGG CGCCGCTGGT CGTCGACGTG GACGCCACCC TGGTCACCGC GCACTCCGAA 
AAGCAGCTGG CAGCAGCAAC ATTCAAGAAG GGCTTCGGGT TCCACCCGAT CGGCGCGTGG 
GCCGACCACG GCCCGGACGG CACCGGTGAA CCCCTGGCGA TGCTGCTGAG GCCGGGCAAC 
GCCGGCTCCA ACACCGCAGC CGACCACATC AGCGTGGTCA AGGCCGCGCT CGCGCAACTG 
CCCTGCACCA CGGCGGACCG ACGGCCCGGC CGCGGTGTGC TGGTCCGCAC CGACGGGGCC 
GGCGGAACCC ACGAGTTCGT GGACTGGATG GCCCGGCAAC GGGTCCAGTA CTCGGTCGGG 
TTCACCCTGA CCACCGACAT CACCGCCAAG GTCGACGCCC TGCCGGAGGC GGCGTGGACA 
CCCGCGTACA ACGCCGACCA GGAGCCCCGG GACGGGGCCT GGGTGGCCGA ACTGACCGGG 
GTCCTCAAGC TCAAGGGCTG GCCCAAGGAC ATGCGGGTCA TCGTCCGCGC CGAACGACCC 
CATCCCGGCG CTCAGCTCAA GTTCACCGAC TCGAACGGCA ACCGGCTCAC CGCGTTCGCC 
ACGAACACCA AAGGCGGACA GCTCGCGGAT CTGGAACTGC GGCATCGGCG CCGCGCCCGC 
TGCGAGGACC GGATCCGCAA CGCCAAGGAC ACCGGCCTGA ACAACCTGCC CCTCAACGAC 
TTTGCCCAGA ATCAAGTGTG GATCGCGGTC GTGCAACTGG CCACCGAACT GACCGCATGG 
ATGCAGATGC TCGCCTTCAC CGGCACCCCG GCGCGGACCT GGGAGCCCAA GAAGCTGCGG 
CACCGACTGT TCAGCGTCGC CGCCCGGATC GGCCGCAAAG CCCGCCGTAC CTGGCTCCGC 
CTGTCCGCGC ACGCACCCCA CCGCGACCTC CTCCTGCACG GCCTGGCCCG GCTGCGGAAC 
CTGCCGCAAC TGACCTGA

Protein sequence

MRKSTGLYPS LRVDATGKRV VSHGGSVLLA LAADRVGLGR GLSAALRPWR KPMAVHDPGK 
ILLDLAISLA IGGDCLADIA QLRAEPAVFG HVASDPTVSR LIDTLAPDAT AALKAIDTAR 
AAARARAWKL AGPAAPNHDR SAKAPLVVDV DATLVTAHSE KQLAAATFKK GFGFHPIGAW 
ADHGPDGTGE PLAMLLRPGN AGSNTAADHI SVVKAALAQL PCTTADRRPG RGVLVRTDGA 
GGTHEFVDWM ARQRVQYSVG FTLTTDITAK VDALPEAAWT PAYNADQEPR DGAWVAELTG 
VLKLKGWPKD MRVIVRAERP HPGAQLKFTD SNGNRLTAFA TNTKGGQLAD LELRHRRRAR 
CEDRIRNAKD TGLNNLPLND FAQNQVWIAV VQLATELTAW MQMLAFTGTP ARTWEPKKLR 
HRLFSVAARI GRKARRTWLR LSAHAPHRDL LLHGLARLRN LPQLT