Gene Namu_3499 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3499
Symbol
ID	8449118
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3842275
End bp	3843381
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	66%
IMG OID	645042577
Product	integrase family protein
Protein accession	YP_003202813
Protein GI	258653657
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.000340769
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.00860577
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGCCAAGA AACGGGGCTT CGGGCAGATC CTTCGGCTCC CCTCGAAGCG GTATCGCGCC 
CGGTACACCG GCCCGGATAC TCAGCTACAC AACGCCCCAT CCACCTTCGA GACCCGGGAA 
GACGCCGAGG CATGGCTCAC CGATGAACGC CGGTTGATCG CCGCCGGGAC CTGGGCGCCG 
CCCGCGCACC GGACCAAGAC GATCGAGCAC CGGACCTTTG GCGACTACGC CACTGACTGG 
CTCACCGCCC GACCGATCAA GCCGCGGACC CGATCCCATT ACGCCATGCT GCTGGACAAG 
TTGATCCTGC CCGGATTCGA GTCCTCACCA CTCAAGACGA TTACCCCCGA TCAGGTCCGG 
GCTTGGCACA CCCGACTCGG TGACTCGACT CCTACCCTGC GAGCGCACGC CTACAGCCTG 
CTGCGGGCGA TCCTCACGGA CGCTGTCCAC GACGGAATCA TCCCGGCCAA CCCGGCGCAC 
ATCCGGGGCG CCGGCAACGC CAAGCGCGTC CACAAGATCA AACCCGCATC GCTGGCGGAG 
TTGGGTGTCC TCGTCGGTGC GATGCCGGAC GCGAAGTACC AGTTGATGAC CCTGTTGGCT 
GCTTGGTGCG GGCTCCGATT CGGCGAACTC ACGGAGCTTC GGCGATCCGA CATAGACGCG 
AAGAACGGCG TGATCCACGT GCGCCGCGGT GTCGTCCGCA CCGACGGCGA GGTGATCGTG 
GGCACCCCGA AGTCTGCTGC TGGACACAGG GACGTCAACA TCCCGCCGCA TCTGCTGCCC 
GCGGTCCGCG ACTACCTCAA GGCCAACGTG AACGGTCGCG ACGGACTCCT ATTCCCCGCC 
GCCGATGGTG TTTCTCACCT TGCCCCATCA AGCCTGTACC GGGTGTTCTA CCCCGCGCGG 
AAGAAGGCCG GACGCCCGGA CCTGCGCTGG CACGACCTGC GGCACACTGG CGCAGTTCTC 
GCCGCAGCGA CCGGCGCCAG CCTGGCCGAA CTCATGGGTC GACTCGGACA TTCAACACCC 
GGTGCGGCCC TCAGATACCA ACATGCCGCG CAGGGCCGGG ATGCTGAGAT CGCCCGCAGG 
CTAAGCCAAC TCGTAGAGGT GAATTGA

Protein sequence

MAKKRGFGQI LRLPSKRYRA RYTGPDTQLH NAPSTFETRE DAEAWLTDER RLIAAGTWAP 
PAHRTKTIEH RTFGDYATDW LTARPIKPRT RSHYAMLLDK LILPGFESSP LKTITPDQVR 
AWHTRLGDST PTLRAHAYSL LRAILTDAVH DGIIPANPAH IRGAGNAKRV HKIKPASLAE 
LGVLVGAMPD AKYQLMTLLA AWCGLRFGEL TELRRSDIDA KNGVIHVRRG VVRTDGEVIV 
GTPKSAAGHR DVNIPPHLLP AVRDYLKANV NGRDGLLFPA ADGVSHLAPS SLYRVFYPAR 
KKAGRPDLRW HDLRHTGAVL AAATGASLAE LMGRLGHSTP GAALRYQHAA QGRDAEIARR 
LSQLVEVN