Gene Namu_3601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3601
Symbol
ID	8449220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	3953576
End bp	3954799
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	69%
IMG OID	645042672
Product	Integrase catalytic region
Protein accession	YP_003202908
Protein GI	258653752
COG category	[L] Replication, recombination and repair
COG ID	[COG4584] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.000351603
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0699896
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAGGATT GGGCTCTGAT CCGGCGGCTG GTGGCGGACG GTGTTCCGCA GCGCCAGGTC 
GCACGGGACC TGGGCATCGG GCGGGCGACG GTGGCGCGGG CGTTGGCTTC GGACCGGCAA 
CCGAAGTACG AGCGGCCAGT GGTGCCGACC TCGTTCACAC CGTTCGAACC GGCGGTGCGT 
CAACTGCTGG CCACGACGCC GGACATGCCG GCCACCGTCA TTGCCGAGCG GGTCGGTTGG 
ACCGGGTCGA TCACCTGGTT CCGCGACAAC GTGCGGCAGC TGCGGCCTGA ACACCGGCCG 
GCCGATCCTT CGGACCGGTT GATCTGGCTG CCCGGCGATG CGGCCCAGTG CGACCTGTGG 
TTCCCGCCGA AGAAGATTCG GCTCGAGGAC GGCAGCAAGA CGCTGCTCCC GGTCATGGTG 
ATCACCGCAG CCCACTCGCG GTTCATGGTC GCCAAGATGA TCCCCACCCG CCACACCGCC 
GACCTCCTGC TGGCGATGTG GCTGTTGCTG CAACTCCTGG GCAGGGTCCC GCGCAGGCTG 
ATCTGGGACA ACGAGTCCGG CATCGGCCGC GGCAAGCGCC ACGCTGAAGG TGTGGGCGCG 
TTCACCGGCG CCCTGGCCAC CACCCTGATC CGGCTCAAGC CCTACGACCC CGAATCGAAA 
GGCGTCGTGG AACGCAGGAA CGGTTACTTC GAGACCTCCT TCATGCCCGG CCGCGACTTC 
ACGTCGCCGG CCGACTTCGA CGCCCAGTTC ACCGACTGGC TCACGATCGC CAACGCCCGA 
GTGGTGCGCA CCATCAAGGC CCGACCCATC GACCGGCTCG ATGCAGACCG GGCGGCGATG 
CTGCCCCTGC CACCAGTGCC GCCAGCGGTG GGTTGGATCA ACCGAGTCCG GCTGGGACGC 
GACTACTACG TCCGCGTCGA CAGCAACGAC TACTCCGTCG ACCCGGCAGT GATCGGCCGG 
TTCGTCGACG TCACCGCCGA CCTGGCACGA GTCCAGGTCC GCCACGAAGG ACGCCTCGTC 
GCAGCCCATG AACGAGTGTG GGCCCGCGGA CAGGTCGTCA CCGACCCCGC CCACGTCGCG 
GCCGCGAAGG CGCTGCGCGA GCAGCTCCAA CTGCCCCGAC CAGCACCCGG CCACCACGAC 
GAACTTGCCC GGGACCTGGC CGACTACGAC CGCGCCTTCG GGCTCATCAC CGGCGGCCTG 
ACCGACGGCG AGGAGGTGGC GTAA

Protein sequence

MEDWALIRRL VADGVPQRQV ARDLGIGRAT VARALASDRQ PKYERPVVPT SFTPFEPAVR 
QLLATTPDMP ATVIAERVGW TGSITWFRDN VRQLRPEHRP ADPSDRLIWL PGDAAQCDLW 
FPPKKIRLED GSKTLLPVMV ITAAHSRFMV AKMIPTRHTA DLLLAMWLLL QLLGRVPRRL 
IWDNESGIGR GKRHAEGVGA FTGALATTLI RLKPYDPESK GVVERRNGYF ETSFMPGRDF 
TSPADFDAQF TDWLTIANAR VVRTIKARPI DRLDADRAAM LPLPPVPPAV GWINRVRLGR 
DYYVRVDSND YSVDPAVIGR FVDVTADLAR VQVRHEGRLV AAHERVWARG QVVTDPAHVA 
AAKALREQLQ LPRPAPGHHD ELARDLADYD RAFGLITGGL TDGEEVA