Gene Namu_2006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2006
Symbol
ID	8447615
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	2214728
End bp	2215774
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	71%
IMG OID	645041134
Product	transposase IS116/IS110/IS902 family protein
Protein accession	YP_003201380
Protein GI	258652224
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.00873285
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00397123
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGTCGGCG GTGTGGACAC CCATAAGGAC ACCCACACCG CGGCAGCGGT GGACACCGCG 
GGGCGGGTGT TGGGGTCGGC CCAGTTCCCC ACCGACGCCG CCGGCTACCG GGCGTTGCTA 
CGGTGGCTGC GCGGGTTCGG GACGCTGCTG CTGGTCGGTG TCGAGGGCAC CGGTGTCTAC 
GGGGCCGGCC TGGCCCGATT GCTGGCCGCC CAGGGCGTGG CCATGGTCGA GGTCGACCGG 
CCCGACCGCA AGGCCCGCCG GTGGCAGGGC AAATCCGATC CCGTCGATGC CGAGGCTGCG 
GCCCGGGCCG CGTTGGCCCG GGTGCGCACC GGGCTGCCCA AGCAGCGAGA CGGTCGTGTC 
GAGGCGCTGC GGGCATTGCG GGTGGCGCGC CGTTCGGCCG TCGGGCACCG CGCTGACGTG 
CAGCGACAGA TCAAGGCGCT GATCGTCACC GCACCGGAAT CGCTGCGCGC CCAGCTGCGG 
GCGTTGCCCG ACCGAGAACT GATCAAGGTC TGCGCCGACC AGCGGCCGGA CCGTGCCGGT 
GCCGGCGATC CGGGCACGGC CACCAAGATC GCGCTGCGCT CTCTTGCTCG GCGCCACCGG 
GCGCTCAGCG TCGAGATCGC CGATCTCGAC GAGCTGCTCG GTCCGCTCGT GGCCCAGATC 
AACCCCGGGC TGCTCGCACT CAAAGGCATC GGTCCCGACG TGGCCGGGCA GATGCTCGTC 
ACGGCCGGCG AGAATGCCGA CCGCCTCACC AACGAGGCCG CCTTCGCGAT GCTGTGCGGC 
GTGGCGCCCT TGCCTGCTTC GTCGGGCAGG ACGACCCGGC ACCGGCTCAA CCGCGGCGGA 
GACCGAGCCG CCAATAGCGC ACTCTGGCGC ATCGTCATCA CCCGCATGGC CACCGACCAG 
AGAACCAAGA ACTACATCGC CCGACGCACC GCCCAGGGGC TGACCAAGCC CGAGATCATC 
CGCTGCCTCA AGCGATATGT CGCCCGAGAA GTCTTCCTCG CGCTTACGTC CGCGTCCGCA 
GAAAAACGAC CCGCCAAAGC AGCTTGA

Protein sequence

MVGGVDTHKD THTAAAVDTA GRVLGSAQFP TDAAGYRALL RWLRGFGTLL LVGVEGTGVY 
GAGLARLLAA QGVAMVEVDR PDRKARRWQG KSDPVDAEAA ARAALARVRT GLPKQRDGRV 
EALRALRVAR RSAVGHRADV QRQIKALIVT APESLRAQLR ALPDRELIKV CADQRPDRAG 
AGDPGTATKI ALRSLARRHR ALSVEIADLD ELLGPLVAQI NPGLLALKGI GPDVAGQMLV 
TAGENADRLT NEAAFAMLCG VAPLPASSGR TTRHRLNRGG DRAANSALWR IVITRMATDQ 
RTKNYIARRT AQGLTKPEII RCLKRYVARE VFLALTSASA EKRPAKAA