Gene Namu_3900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3900
Symbol
ID	8449519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4301145
End bp	4302698
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	69%
IMG OID	645042946
Product	transposase IS4 family protein
Protein accession	YP_003203182
Protein GI	258654026
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.0647808
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0233728
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGGGTC GGTCGCGGGA TCAGCGTGAG TTGTTGGATG CCGAGTCGGT AGTCGGTGGG 
CTGCTCAAGC CGGGCAGCGT GTTCGCGTTT CTGGCCGCGC ACCGGCGGGA GGTGTTCCCG 
GACGGCATGT TCGCGGATCT GTTTCCGTCG GGTCGGGGCC GCCCGTCAGT GCCGGCCGAC 
GTGATGGCCT CGGTGATCGT GTTGCAGTCG TTGCACGGCC TGTCCGACGC GGACACGGTG 
GACTCGGTGA CGTTCGATCT GCGGTGGAAG GCAGCGTGCG GGTTACCGGT GACCGCTGCG 
GCGTTCCATG CCACGACATT GACGTACTGG CGGCGTCGGC TGGCCGCTTC GCAGTCGCCG 
AACCGGATCT TCGACGCGGT CCGCCAGGTC GTGGACCAGA CCGGGGTGCT GGCTGGAAAG 
AGCAGGCGAG CGTTGGATTC CACGATCCTG GACGACGCGG TCGCCACCCA GGACACGGTC 
ACCCAGTTGA TCGCGGCGAT CCGCCGGGTC CGCCGCGAGG TACCCGGCGC CGCCGAGGTC 
GTCGGCGAGC ACTGCTCGGC TCACGACTAT GACGACCCGG GCAAACCGGC GATCGCCTGG 
AACGATCAGC AGGCCCGCGA GGCCCTTGTC GATGCGCTGG TCACCGACGC GCATCGGGTG 
CTGGGACACC TGCCCGACCA GGAGCTCGGA CCGAAGGCGG CGGACGCGGT CGCCCTCTTG 
GCGTTGGTCG CCGGGCAGGA CGTGGAACCG GTCGAGGGCT CGGACGGCAC CGACGGACGG 
TGGCGGATCG CGCAGCGGGT CGCCCCGGAC CGGGTGATCT CCACCGTGGA CCCGGAGGCG 
CGGCACGCCC ACAAGACCGT CCACCGGCGG CAGGACGGGT TCAAGGCACA CATCGCGGTC 
GAACCCGACA CCGGTCTGGT CACCGCCTGC GCGGTGACCA TGGCCAGCGG ACGCGGCAAC 
AGCGACGCCG AGGTTGGACC CACCTTGCTG GCACAGGAGA CCGAAAAGCT GCACGTGCTG 
GCCGATTCGG CGTACGGATC GGGATCCGCG CGGGCCGAAC TGGACCATGC CGGGCACATC 
GCGTTGATCA AGCCGTTCCC GCTGCGGTCG GCCGTGCCGG GCGGGTTCAC CCTGGACGAC 
TTCACCGTCG ACCCCGAGGC CAGGACGGCC ACCTGCCCGA ACGGGGTGAC CCGGTCGATC 
ACCGCGCAAT GGTCCGTCAC CTTCGGAGCG GCTTGCCGCG GCTGCCCGCT CCGGGCCCAA 
TGCACGACCA GCGACGCCGG TCGATCGCTG AAGCTGACCG AGTACGAAAG CCTGCTCAGG 
GCGGCCCGTC GACAAGCGGA AACCGAGGAC TTCCAACAGG TCTACCGACG GCACCGGCCG 
ATGGTCGAAC GATCGATCTC CTGGCTGGTC CGCGGCAACC GCAAAGTCCG CTACCGCGGC 
GTCGCCAAGA ACGACCACTG GTGGCACCAC CGCGCCGCTG CGATCAACCT CAGGCGAATG 
CTCACCCTCG GGCTGACGCG GGTGAGCGGG ACGTGGACCA TTGCACCGGC CTGA

Protein sequence

MQGRSRDQRE LLDAESVVGG LLKPGSVFAF LAAHRREVFP DGMFADLFPS GRGRPSVPAD 
VMASVIVLQS LHGLSDADTV DSVTFDLRWK AACGLPVTAA AFHATTLTYW RRRLAASQSP 
NRIFDAVRQV VDQTGVLAGK SRRALDSTIL DDAVATQDTV TQLIAAIRRV RREVPGAAEV 
VGEHCSAHDY DDPGKPAIAW NDQQAREALV DALVTDAHRV LGHLPDQELG PKAADAVALL 
ALVAGQDVEP VEGSDGTDGR WRIAQRVAPD RVISTVDPEA RHAHKTVHRR QDGFKAHIAV 
EPDTGLVTAC AVTMASGRGN SDAEVGPTLL AQETEKLHVL ADSAYGSGSA RAELDHAGHI 
ALIKPFPLRS AVPGGFTLDD FTVDPEARTA TCPNGVTRSI TAQWSVTFGA ACRGCPLRAQ 
CTTSDAGRSL KLTEYESLLR AARRQAETED FQQVYRRHRP MVERSISWLV RGNRKVRYRG 
VAKNDHWWHH RAAAINLRRM LTLGLTRVSG TWTIAPA