Gene Namu_1596 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1596
Symbol
ID	8447194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	1758255
End bp	1759655
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	74%
IMG OID	645040723
Product	hypothetical protein
Protein accession	YP_003200980
Protein GI	258651824
COG category	[S] Function unknown
COG ID	[COG5282] Uncharacterized conserved protein
TIGRFAM ID	[TIGR03624] putative hydrolase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.552209
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.160274
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGTAACG TGGGCCGCAT GACGAATCTG CCCTTCGGAT TCAGCCCATC CGGAGATGAC 
GACCCCGACG GCAAGCCGGG CCAGGGCCCG GGGCCAGGCG GTTTCGACCT CGGCCAGCTC 
GGCTCGATGC TCTCCCAGCT CGGCCAGATG ATGTCGCAGG CGAACGCCTC AGGTGCCTCC 
ACCGGCCCGG TCAACTACGA CCTGGCGCGC CGGCTGGCCA CCTCCCAGTT GCCCGCCTCC 
CACCCGGCCT CCGCGGTCGA CGTGAACAAG GTGGTCGAGG CGATCAAGCT GGCCGAAGTC 
TGGCTGGACG GCGCGACCGC GCTGCCCGCC GGGGCCCGCA CGGCCACCGC CTGGACGCCC 
CGCCAGTGGG TGGACGCGAC CATGCCGGCC TGGGAGAAGC TGTGCTCCCC CATCGCCGAG 
CAGGTCTCCC GCGCCTGGGT GGACGGGCTG CCCGAGCAGG CCAAGGCCCA GGCCGGACCG 
CTGCTGGCGA TGATGGGCTC GATGGGCGGC ATGGCCTTCG GCTCGCAGCT GGGCCAGGGG 
CTGGCCCAGC TGGCCACCGA GGTGCTCACC TCCACCGACG TCGGCATCCC GCTCGGACCC 
GAGGGCACCG CCGCGCTGCT GCCCCGCTCG ATCAGCGAGT TCGGCGCCGG GCTGAACCTG 
CCCGAGGACC AAGTGCGGCT GTACCTGGCC GTCCGCGAGG CGGCCCACCA CCGGCTGTAC 
GCGGGCACCC CGTGGCTGCG GGACCGGGTG GTCGCGCTGA TCAACGACTA CGCGCGGGCC 
ATCTCGGTCG ACTTCTCCGC GGTCGAGCAG CTGGCCTCCA ACATCGACCC GTCCGACCCG 
GCCAGCATCG AGGCGGCGCT GGGCCAGGGC ATGTTCGAGC CGACCATCAC CCCCGGCCAG 
CAGGCCGCGA TGGCCGAGCT GGAGACCCTG CTCGCGCTGG TCGAGGGCTG GGTGGACACG 
GTCGTCGCCG ACGCGGTCGG CGAACGGCTG CCGGGGGCCA ACGCGCTGCG CGAGACGCTG 
CGCCGGCGCC GGGCCACCGG TGGGCCGGCC GAGCAGACCT TCGCCACCCT CATCGGCCTG 
GAGCTGCGGC CCCGGCGGCT GCGCGCCGCC GCCGAGCTGT GGCAGGCCGT GGGCGAGTCC 
CGCGGCACGG ACGGCCGGGA CGCCCTGTGG GCCGACCCGG GCCTGCTGCC CTCGGGCACC 
GACCTGGACG ACCCGAAGGG CTTCGTCGAA CGCGACAAGC AGTTCACCGA GCTGCTCGCC 
GGGTTGGACG ACATCGAGAC CCAGCTGCTG GGCAAGCCGG ACGACGCGAC CGACCCGGCC 
GATTCAGCCG CTCCGGCTGA TTCCCGGGAC CCGGCCGGCG ACGACGGCAA CCCCGACGAG 
CAGCCGCCGC GCCCGGTCTG A

Protein sequence

MRNVGRMTNL PFGFSPSGDD DPDGKPGQGP GPGGFDLGQL GSMLSQLGQM MSQANASGAS 
TGPVNYDLAR RLATSQLPAS HPASAVDVNK VVEAIKLAEV WLDGATALPA GARTATAWTP 
RQWVDATMPA WEKLCSPIAE QVSRAWVDGL PEQAKAQAGP LLAMMGSMGG MAFGSQLGQG 
LAQLATEVLT STDVGIPLGP EGTAALLPRS ISEFGAGLNL PEDQVRLYLA VREAAHHRLY 
AGTPWLRDRV VALINDYARA ISVDFSAVEQ LASNIDPSDP ASIEAALGQG MFEPTITPGQ 
QAAMAELETL LALVEGWVDT VVADAVGERL PGANALRETL RRRRATGGPA EQTFATLIGL 
ELRPRRLRAA AELWQAVGES RGTDGRDALW ADPGLLPSGT DLDDPKGFVE RDKQFTELLA 
GLDDIETQLL GKPDDATDPA DSAAPADSRD PAGDDGNPDE QPPRPV