Gene Namu_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1049
Symbol
ID	8446645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	1158713
End bp	1160674
Gene Length	1962 bp
Protein Length	653 aa
Translation table	11
GC content	72%
IMG OID	645040187
Product	hypothetical protein
Protein accession	YP_003200446
Protein GI	258651290
COG category
COG ID
TIGRFAM ID	[TIGR02243] conserved hypothetical protein, phage tail-like region

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCTGC CCGCACCGAA TCTGGACGAC CGTACCTTCC AGGACATCGT CGACGAGGCC 
AAACGGCTGA TCCCCCGGTA CACGCCGGAA TGGACCAACC ACAACCTGTC CGACCCCGGG 
GTCGCCCTCA TCGAGCTGTT CGCCTGGATG AGCGAGATGG TGCTGTACCG GGTCAATCAG 
GTGCCGGACC GGCTGTACGT GCACTTTCTG AACCTGGTCG GGATCGACCC CTTCCCGCCA 
TCGGTGGCCC GGGCGGACGT CACGTTCTGG CTGTCCGCGG CCCAGGACGC GGTGGTCACC 
GTGCCCGAGG GCACCCAGAT CACCACCGCC CGGGACACCA TGGCCGAACG GGCGATCGTG 
TTCACCACGG TGGACCGGCT GGACATCCGG CCGCCCGAGC TGGTCGCCGC GATCACCACC 
GACGCGCGGA CCGAACGGCT CACCGACGTG ATCGACGATC TGCGCTACGA GGGCTCGTCG 
GTGACCTGCT TCAGCACGGT CGACCGGACC GGAGCCCTCG TGCCGGGCGA CGCGCTGCTG 
CTCGGTTTCG CCCGGTCGCT GGCCGGGATG GCCATCCGGC TGTTCGTCTC GGCGGTCGCC 
AAGGGCATCG GGGTGGACCC GCAGCGTCCA CCGCTGGCCT GGGAGGTGTG GAACGGCGAG 
GCCTGGATCG CGGTGGACGT GTTCACCGAC ACCACCGGCG GGCTCAACCG CTCCGGCGAG 
ATCGTGCTGC TCGTGCCCGG CGAGCACGAG TCGCTGACCC TGGGCGAGAC CAGCTCCTAC 
TGGTTGCGGG TGCGGCTGAT CCCGGCCCGG GCCGGCCAGC CCACCTACCA GGAGGCGCCG 
CGGATCGACG ACCTGCGCGC GGAGGCCATC GGGGCGACCG TGCGGGCCGA GCACGCCTCG 
CCATCGCCCG CGGAGGTCCT CGGGCGTTCC GACGGCAGCC CGGGCCAGGA GTACCGGGTC 
AGCTTCCCGC CGATCCTGCC CCGCCGCGCC GGCGAAGGCG TGCGGGTGAC CGACACCGGC 
GGGTCGGTGG AATGGACCGA GGTGGAGGAC TTCTCCCGGT CCGGGCCGGG CGACCGGCAC 
TTCGTCTGGG ATTCCGCCTC CGGCGAGGTC CGGTTCGGGC CGCGGATCCG GTACGCCGAC 
GGATCGGTCC GCCAGCACGG CATGATCCCC CGGGACGGTG CCGAGATCGC CGTCACCGGC 
TACCGTTTCG GCGGCGGGGC GGCCGGCAAC GTGGGGGCCC GGACGCTCAC CGCGATGCGT 
ACGTCGGTGC CGTTCGTGTC CGGCTGCGTG AACCTGCGGG CGGCCACCGG TGGGGTCGAC 
GCGGAGACCG TGGCCGAGGC CAAGGCCCGC GGCCCGATGA CCCTGCGCAC CGGCCAACGC 
GCCGTCACCG CCGGCGATTT CGAGCGGCTG GCGCTGGAGT CCTCGGTCGA GGTAGCCCGG 
GCCCGCTGCC TGCCGTCGGC GACCGGGCGG GGCCCGGTGC GGCTGCTGGT GGTGCCGGCC 
GTGCGCACCG ATCCCAAGGC GCAGCAGCTC GACGACTACG CGCTGGCCGC CCCGCTGATG 
CGCACGATTA CCGATCACCT GGACCGGCAC CGCATCGTCG GCACCGCCAT CGAGGTGGGA 
ACCCCGTACT ACCAGGGGGT GTCGGTGGCC GCGCTGGTCC ACGCGCCGCC CGGACGGCCG 
CTGGCCCTGG TCCGCCAGCG GGCCATCGAC GAGCTGACCC GCTACATCAA TCCGCTGACC 
GGCGGCGCGG ACGGGGCCGG CTGGTTGTTC GACGTCGACC TGAACGCGGC CGCCATCGCC 
CAACTACTGG AGACCGTCGA GGGGGTCGAG CGGGTCGATG AGGTGCAGCT GTTCGAGTTC 
GACCTGCGCA CCCGTCAGCG GGTCGGCTCC GGCCGCGACG TCATCCGGCT GGACCGGCAC 
TCGCTGTTCC TGTCCGGGAA CCACCGGGTC GTCGTGCGAT GA

Protein sequence

MALPAPNLDD RTFQDIVDEA KRLIPRYTPE WTNHNLSDPG VALIELFAWM SEMVLYRVNQ 
VPDRLYVHFL NLVGIDPFPP SVARADVTFW LSAAQDAVVT VPEGTQITTA RDTMAERAIV 
FTTVDRLDIR PPELVAAITT DARTERLTDV IDDLRYEGSS VTCFSTVDRT GALVPGDALL 
LGFARSLAGM AIRLFVSAVA KGIGVDPQRP PLAWEVWNGE AWIAVDVFTD TTGGLNRSGE 
IVLLVPGEHE SLTLGETSSY WLRVRLIPAR AGQPTYQEAP RIDDLRAEAI GATVRAEHAS 
PSPAEVLGRS DGSPGQEYRV SFPPILPRRA GEGVRVTDTG GSVEWTEVED FSRSGPGDRH 
FVWDSASGEV RFGPRIRYAD GSVRQHGMIP RDGAEIAVTG YRFGGGAAGN VGARTLTAMR 
TSVPFVSGCV NLRAATGGVD AETVAEAKAR GPMTLRTGQR AVTAGDFERL ALESSVEVAR 
ARCLPSATGR GPVRLLVVPA VRTDPKAQQL DDYALAAPLM RTITDHLDRH RIVGTAIEVG 
TPYYQGVSVA ALVHAPPGRP LALVRQRAID ELTRYINPLT GGADGAGWLF DVDLNAAAIA 
QLLETVEGVE RVDEVQLFEF DLRTRQRVGS GRDVIRLDRH SLFLSGNHRV VVR