Gene Namu_2232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2232
Symbol
ID	8447843
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	2461088
End bp	2462488
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	65%
IMG OID	645041354
Product	transposase IS116/IS110/IS902 family protein
Protein accession	YP_003201598
Protein GI	258652442
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.000585875
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.443218
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATGACCA AACAGGTCGA GGAGATCCTC GACGAACCCC ATGAACAGAT CGTGCAGCGG 
GTCTGCGCGA TCGACGTGGG CAAGGACTCG GGCACAGTCT GCGTTCGCGT ACCAGCCGCG 
TCCGGGACGG GTCGGCGAGT GAGCAAAGTC TGGGACGTCC CGGCCCGAAC CAGAGCGGTC 
CTGGGCCTGG CCGCACAGCT GTCAGACCAG GGCATCGAGA AGGTGACCCT GGAATCGACT 
TCGGACTACT GGCGGATCTG GTTCTATCTG CTGGAAGCTC ATGGCCTGGA CGTGCAGTTG 
GTCAATGCCC GCGATGTCAA GAACGTCCCC GGTCGCCCCA AAACGGACAA GCTGGACAGT 
GTGTGGTTGG CCAAGCTCAC CGAGAAGGGG CTGTTGCGTC CATCGTTCGT GCCATCAGCG 
CAGGTCCGGC AGTTGCGCGA CTACACCCGG ATGCGGGCCG ATCTGACCGG CGACCGGACC 
AGGTACTGGC AACGGCTGGA GAAGCTGCTG GAGGACGCCC TGATCAAGGT CACCTCCGTG 
GCGAGCAGGA TCGACACCCT GTCCGTCCGG GACATGATTG AGGCCCTGAT CGCGGGCCAG 
CGGGACCCGC GGGTTCTGGC CGGCATGGCC CGCGGCCGGA TGCGGCTCAA GTACGCCGAC 
CTGGTCGAGT CGCTGACCGG TCAGTTCGAC GATCATCACG CCGAGCTGGC CCGGATGCTG 
CTGCATCAGA TCGACACGCT GACCGATCAG ATCGACGTCC TGACCGCACG CATCGAGGCA 
CTCCTGGCCA GCTTGCCGGC CGGTAACACC CCCGATCCGG ACCGCCCCGC ACCGGATGGC 
CAAACTCGGC CCGGTACGAG GGCTAACGCA CCCGCCGACG AGGCGGCCCA GCGCCGGACA 
CCGCCGACGG CCGCAGACAT GATCAAGATC CTGGACCAGA TACCCGGGAT CGGCCCAAGC 
AACGCACAGG TCATCATCGC CGAGATCGGG CTGGACATGA GCCGGTTCCC GACCGCTGGC 
CATCTGGTGT CCTGGACCCG GCTGTGCCCC CGCACGATCC AGTCCGGGAA ACGATCAACA 
ACCGGTAAGA CCGGCAAGGG CAACCGTTAC CTGCGCGCCG TGCTTGGTGA AGCGGCCGCG 
ACCGGCGGCA AGACCCAAAC CTTCCTGGGA GAACGCTATC GACGCCTGAT CAAACGCCGC 
GGCAAACTCA AAACGATCGT CGCCATCGCC CGATCCATCC TTGTCATCAT CTGGCACCTG 
CTCGCCAACC CCGGCACGAC CTTCCACGAC CTCGGCGTCG ATTTCAACGA CCACCGCATC 
GACATCGGAC GCCGAACCCG TAACCACGTC CGGCAACTCG AAGCCCTCGG CTTCAACGTC 
ACCCTGACCG CGGCCGCCTA A

Protein sequence

MMTKQVEEIL DEPHEQIVQR VCAIDVGKDS GTVCVRVPAA SGTGRRVSKV WDVPARTRAV 
LGLAAQLSDQ GIEKVTLEST SDYWRIWFYL LEAHGLDVQL VNARDVKNVP GRPKTDKLDS 
VWLAKLTEKG LLRPSFVPSA QVRQLRDYTR MRADLTGDRT RYWQRLEKLL EDALIKVTSV 
ASRIDTLSVR DMIEALIAGQ RDPRVLAGMA RGRMRLKYAD LVESLTGQFD DHHAELARML 
LHQIDTLTDQ IDVLTARIEA LLASLPAGNT PDPDRPAPDG QTRPGTRANA PADEAAQRRT 
PPTAADMIKI LDQIPGIGPS NAQVIIAEIG LDMSRFPTAG HLVSWTRLCP RTIQSGKRST 
TGKTGKGNRY LRAVLGEAAA TGGKTQTFLG ERYRRLIKRR GKLKTIVAIA RSILVIIWHL 
LANPGTTFHD LGVDFNDHRI DIGRRTRNHV RQLEALGFNV TLTAAA