Gene Namu_3595 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3595
Symbol
ID	8449214
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3948098
End bp	3949234
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	69%
IMG OID	645042667
Product	transposase IS204/IS1001/IS1096/IS1165 family protein
Protein accession	YP_003202903
Protein GI	258653747
COG category	[L] Replication, recombination and repair
COG ID	[COG3464] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0104734
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.17723
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCCGGC GGTTGGCCCA CGAGCCGCTG GGCTGGCGAC CGACCGTGCT GGAAGTTGTA 
GTGCGCCGCT ACCGCTGTGC CGACTGCGGA CACGTGTGGC GCCAAGACAC CAGCGCCGCG 
GCGGAGCCAC GCGCGAAGCT CTCGCGCACC GGGCTGCGGT GGGCGCTGGA AGGGATCGTG 
GTCGCACACC TCACCGTCGC CCGTGTCGCC GGGGGACTCG GGGTCGCGTG GGACACCGCC 
AACAACGCGG TCCTGGCTGA AGGCAATCGG CTGCTGATCA ACGACCCCAC GCGGTTTGAG 
GGCGTGAAGG TCATTGGCGT CGATGAGCAC GTCTGGCGCC ACACCAGGCG TGGCGACAAG 
TACGTCACCG TGATCATCGA CCTCACCCCG GTCCGCGATG GCGCCGGCCC AGCAAGGCTG 
CTGGACATGG TCGAGGGCCG GTCGAAGGCG GCGTTCAAGA CCTGGCTCGC CGACCGCGAC 
GACGCCTTCC GTGACGCGGT CGAGGTGGTC GCGATGGACG GCTTCACCGG GTTCAAGACC 
GCCGCTGCAG AGGAGATCCC GGACGCGGTC ACGGTGATGG ATCCCTTCCA CGTCGTGCGC 
CTGGCCGGTG ACGCCCTCGA CAGGTGCCGG CGCCGGGTCC AACTCGCGAT CCACGGGCAC 
CGTGGGTTCA GGGACGACCC GCTCTACAAG TCGCGGCGCA CGCTGCACAC CGGCGCGGAC 
CTGCTCACCG ACAAGCAGAG CGACAGGCTA CGCGCGCTGT TCGTTGATGA CGCTCACGTC 
GAGGTCGAGG CGACCTGGGG TGTCTACCAG CGCATGATCG CCGCCTATCG CCACGAGGAC 
CGGCAACGTG GCCGCGAGCT CATGGAGAAG CTGATCACCG ACCTCAGCGC CGGCGTCCCC 
AAGGTGCTCA CCGAGCTCAC CACCCTGGGC CGGACCCTGA AGAAGCGAGC CGCTGACGTG 
CTCGCCTACT TCGAACGACC CGGCACCAGC AACGGGCCGA CCGAGGCGCT CAACGGACGG 
CTCGAACACC TGCGCGGCTC CGCACTCGGG TTCCGCAACC TGACCAACTA CATCGCCCGA 
AGCCTGCTCG AGACCGGCGG CTTCAGACCC CAACTCCTAC ACCCCCGATT GGGATGA

Protein sequence

MIRRLAHEPL GWRPTVLEVV VRRYRCADCG HVWRQDTSAA AEPRAKLSRT GLRWALEGIV 
VAHLTVARVA GGLGVAWDTA NNAVLAEGNR LLINDPTRFE GVKVIGVDEH VWRHTRRGDK 
YVTVIIDLTP VRDGAGPARL LDMVEGRSKA AFKTWLADRD DAFRDAVEVV AMDGFTGFKT 
AAAEEIPDAV TVMDPFHVVR LAGDALDRCR RRVQLAIHGH RGFRDDPLYK SRRTLHTGAD 
LLTDKQSDRL RALFVDDAHV EVEATWGVYQ RMIAAYRHED RQRGRELMEK LITDLSAGVP 
KVLTELTTLG RTLKKRAADV LAYFERPGTS NGPTEALNGR LEHLRGSALG FRNLTNYIAR 
SLLETGGFRP QLLHPRLG