Gene Namu_2973 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2973
Symbol
ID	8448586
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	3258826
End bp	3260226
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	65%
IMG OID	645042058
Product	transposase IS116/IS110/IS902 family protein
Protein accession	YP_003202300
Protein GI	258653144
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.0717724
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0172565
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATGACCA AACAGGTCGA GGAGATCCTC GACGAACCCC ATGAACAGAT CGTGCAGCGG 
GTCTGCGCGA TCGACGTGGG CAAGGACTCG GGCACAGTCT GCGTTCGCGT ACCAGCCGCG 
TCCGGGACGG GTCGGCGAGT GAGCAAAGTC TGGGACGTCC CGGCCCGAAC CAGAGCGGTC 
CTGGGCCTGG CCGCACAGCT GTCAGACCAG GGCATCGAGA AGGTGACCCT GGAATCGACC 
TCGGACTACT GGCGGATCTG GTTCTATCTG CTGGAAGCTC ATGGCCTGGA CGTGCAGTTG 
GTCAATGCCC GCGATGTCAA GAACGTCCCC GGTCGCCCCA AAACGGACAA GCTGGACAGT 
GTGTGGTTGG CCAAGCTCAC CGAGAAGGGG CTGTTGCGTC CATCGTTCGT GCCATCAGCG 
CAGGTCCGGC AGTTGCGCGA CTACACCCGG ATGCGGGCCG ATCTGACCGG CGACCGGACC 
AGGTACTGGC AACGGCTGGA GAAGCTGCTG GAGGACGCCC TGATCAAGGT CACCTCCGTG 
GCGAGCAGGA TCGACACCCT GTCCGTCCGG GACATGATTG AGGCCCTGAT CGCGGGCCAG 
CGGGACCCGC GGGTTCTGGC CGGCATGGCC CGCGGCCGGA TGCGGCTCAA GCACGCCGAC 
CTGGTCGAGT CGCTGACCGG TCAGTTCGAC GATCATCACG CCGAGCTGGC CCGGATGCTG 
CTGCATCAGA TCGACACGCT GACCGATCAG ATCGACGTCC TGACCGCACG CATCGAGGCA 
CTCCTGGCCA GGTTGCCGGC CGGTAACACC CCCGATCCGG ACCGCCCCGC ACCGGATGGC 
CAAACTCGGC CCGGTACGAG GGCGAACGCA CCCGCCGACG AGGCGGCCCA GCGCCGGACA 
CCGCCGACGG CCGCAGACAT GATCAAGATC CTGGACCAGA TACCCGGGAT CGGCCCAAGC 
AACGCACAGG TCATCATCGC CGAGATCGGG CTGGACATGA GCCGGTTCCC GACCGCTGGC 
CATCTGGTGT CCTGGACCCG GCTGTGCCCC CGCACGATCC AGTCCGGGAA ACGATCAACA 
ACCGGTAAGA CCGGCAAGGG CAACCGTTAC CTGCGCGCCG TGCTCGGTGA AGCGGCCGCG 
ACCGGCGGCA AGACCCAAAC CTTCCTGGGA GAACGCTATC GACGCCTGAT CAAACGCCGC 
GGCAAACTCA AAACGATCGT CGCCATCGCC CGATCCATCC TTGTCATCAT CTGGCACCTG 
CTCGCCAACC CCGGCACGAC CTTCCACGAC CTCGGCGTCG ACTTCAACGA CCAACGCATC 
GACATCGGAC GCCGAACCCG TAACCACGTC CGGCAACTCG AAGCCCTCGG CTTCAACGTC 
ACCCTGACCG CGGCCGCCTA A

Protein sequence

MMTKQVEEIL DEPHEQIVQR VCAIDVGKDS GTVCVRVPAA SGTGRRVSKV WDVPARTRAV 
LGLAAQLSDQ GIEKVTLEST SDYWRIWFYL LEAHGLDVQL VNARDVKNVP GRPKTDKLDS 
VWLAKLTEKG LLRPSFVPSA QVRQLRDYTR MRADLTGDRT RYWQRLEKLL EDALIKVTSV 
ASRIDTLSVR DMIEALIAGQ RDPRVLAGMA RGRMRLKHAD LVESLTGQFD DHHAELARML 
LHQIDTLTDQ IDVLTARIEA LLARLPAGNT PDPDRPAPDG QTRPGTRANA PADEAAQRRT 
PPTAADMIKI LDQIPGIGPS NAQVIIAEIG LDMSRFPTAG HLVSWTRLCP RTIQSGKRST 
TGKTGKGNRY LRAVLGEAAA TGGKTQTFLG ERYRRLIKRR GKLKTIVAIA RSILVIIWHL 
LANPGTTFHD LGVDFNDQRI DIGRRTRNHV RQLEALGFNV TLTAAA