Gene Namu_3472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3472
Symbol
ID	8449087
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3820811
End bp	3822199
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	67%
IMG OID	645042546
Product	transposase mutator type
Protein accession	YP_003202786
Protein GI	258653630
COG category	[L] Replication, recombination and repair
COG ID	[COG3328] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.00565212
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00216931
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCATGA CCGAGCAGTC CTCATCGGTG CCGTCGTCGC CGGTCGATGA TGAGGTGCCG 
GGTCCGGCCC GGTCGACTGG TCGGCAGCTG CGGGAGTTGC TGGCCGACGA CGTGTGGCTG 
GATGAGTTGA TCGACCGCGC CGAGGCCGGC GGGGTCAGGT TGACCGGCGA GGGCGGGTTC 
TTGCCGGAGA TGATCAAGGC TGTGCTCGAA CGAGGCCTGG CCGCGGAATT GACCGGGCAC 
CTGGGCTACG AAGCGGGCGA CCCGGCTGGT CGGGGCTCGC CGAACAGTCG GAACGGGCAC 
ACCCCGAAAA CGCTCTCGAC CGAGGTCGGT CCGGTTCCGT TGAGCGTGCC GCGGGACCGC 
AAGTCGACGT TCGAGCCGCG GCTGGTGCCC AAGGGCCAAC GCCGCCTGGG CGGGTTGGAC 
GAGCAGATCA TCAGCCTCTA CGCCGGCGGC ATGACCGTCC GCGATATCCA GGCCCATCTG 
GCCCGGACAC TGGGCACCGA GCTGTCCCAC GACACGATCA GCAAGATCAC CGACGCGGTC 
CTGGAAGAGG TCAAGGCCTG GCAGTCCCGG CCGTTGGAAG AGCTCTACCC GATCATGTAC 
CTGGACGCGA TCGTGGTGAA GGTCCGCGAC GGGCACCAGG TTCGGAACAA GAGCGCGTAC 
ATCGCCGTCG GCGTCGATAT GGCCGGGATC AAGCACGTGC TGGGGATCTG GGTGCAGTCC 
ACCGAGGGCG CCAAGTTCTG GGCCGGGGTC TGCGCCGAGC TGGCCAACCG GGGCGTCAAG 
GACGTGCTGA TCGTGTGTTG CGACGGGCTG ACCGGGCTAC CCGAGGCGAT CGAGGCGACC 
TGGCCGCGGA CGACCGTCCA AACGTGTGTG GTCCACCTGA TCCGGGCCTC GATGCGGTTC 
GTGTCCTACA CCGACCGGCG GGCTGTCGTG GCCCAGCTCA AGACGATCTA CACCGCCCCG 
ACCGTGGACG CCGCCGAGAC GGCGCTGTTG ACGTTCGCCG AGACCGATCT GGCCCGCCGC 
TACCCGGCCT GCCTGCGGAC CTGGCAGGAC GCCTGGGACC GGTTCATCCC GTTCCTGGCG 
TTCCCATGGC CGGTCCGCAA GATCATCTAC ACCACGAACG CGATCGAGTC GTTGAACTAC 
CAGCTCCGCA AGATCATCAA GAACCGCGGG CACTTCCCCA ACGACGACGC AGTGGTCAAG 
CTGCTGTGGC TGGCCATCCG CGATATCGAG GACAAACGCG CCCGGGACCG GGCCGCGGAG 
AAGGGCAAAC GAGTCGGACG CACCGCCGAG GGCCGGCTCG TCGAGGGCCA GGTCACCACC 
GGTTGGAAAC CCGCGCTCGG TGCACTGGCC ATCCAATACC CCGACCGCAT CACCCCCAGG 
ATCAGCTGA

Protein sequence

MTMTEQSSSV PSSPVDDEVP GPARSTGRQL RELLADDVWL DELIDRAEAG GVRLTGEGGF 
LPEMIKAVLE RGLAAELTGH LGYEAGDPAG RGSPNSRNGH TPKTLSTEVG PVPLSVPRDR 
KSTFEPRLVP KGQRRLGGLD EQIISLYAGG MTVRDIQAHL ARTLGTELSH DTISKITDAV 
LEEVKAWQSR PLEELYPIMY LDAIVVKVRD GHQVRNKSAY IAVGVDMAGI KHVLGIWVQS 
TEGAKFWAGV CAELANRGVK DVLIVCCDGL TGLPEAIEAT WPRTTVQTCV VHLIRASMRF 
VSYTDRRAVV AQLKTIYTAP TVDAAETALL TFAETDLARR YPACLRTWQD AWDRFIPFLA 
FPWPVRKIIY TTNAIESLNY QLRKIIKNRG HFPNDDAVVK LLWLAIRDIE DKRARDRAAE 
KGKRVGRTAE GRLVEGQVTT GWKPALGALA IQYPDRITPR IS