Gene Namu_3126 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3126
Symbol
ID	8448740
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	3446975
End bp	3448195
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	73%
IMG OID	645042207
Product	secretory lipase
Protein accession	YP_003202448
Protein GI	258653292
COG category	[I] Lipid transport and metabolism
COG ID	[COG2267] Lysophospholipase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0242733
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0408746
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATCCCC GGAGCCGCTG GATCGCTGCG CTGGCCACCG CCGGCCTGCT GCTGGGCGGC 
TGCGCGCAGT CGACCGACTC CCGGTTGGAG CAGGGGGCGC TGGAGGAGGC GACCGAGCAG 
TCGTTCTACG CGCTGCCCGA CCCGATCCCG GCTGGCGGTC CGGGTGAGGT GGTCCGCACC 
GAACAGCTGC AGTCGGCCCC GGCCGGCACC ATCGCCTGGC GGGTCATGTA CCACTCCACC 
GACGTCACCG GGGCGTCGAT CCTGACCTCG GCGGTGGTGA TCGCACCGAC CGCGCCGTGG 
CCCGGCGGGG GTCCGCGGCC GGTGGTGGCC TGGGGTCATC CGACGACCGG GATGGCCGGC 
CACTGCGCGC CCTCGACCGG CGTCGATCCG TTCGACCTGA TCGAGGGCAT GACCGATCTG 
CTGAACGCCG GCTACGCGGT CGCCGCGGCC GACTACCCGG GGATGGGGGT GGCCGGTCCC 
GACGCCTACC TGGTGGGGGT CAGCGAGGGC AACAGCGTGC TGGATGCGGT CCGCGCCGCG 
CAGCACATCG AGCAGACGGG CGCCACCGCG GCCGGTGACG TGCTGCTGTG GGGGCATTCG 
CAGGGCGGCC ATGCGGTGCT GTTCGCCGCG CAGCAGGCGG CCGGCTACGC CCCGGAGTTG 
AAGGTGCGGG CGGCCGCGGT GGCCGCGCCC GCGACCGAGC TCGGCGCCCT GCTCAACGAC 
GACATCGGCG ACGTCTCCGG GGTGTCCCTT GGCTCCTATG CGTTCCAGAC CTACCAGAGC 
GTCTACGGGC CGAGCATCCC CGGGATGAGC CTGACCCAGG TGCTCACCGA TGCCGGCGCC 
GCGGCCACGC CGCAGATGGC GGCGCTGTGC CTGATCGGCC AGAACAGCGA GCTGCACGCG 
ATCGCCGGGC CGCTGGTCGG CCAGTACCTG CGCAGCGACC CGACCACGAC GGCGCCGTGG 
TCGGACATCC TCGCGCAGAA CACCCCGGGC GGCGTGCCGA TCACCGTGCC GCTGCTGGTC 
GCCCAGGGCG AGGCCGACGA GTTGGTGCAT CCGGCAGCGA CGCAGCAGTT CGTGACGCAG 
CAGTGCGCCA AGGCCGCGCA CGTGATCTTC AAGCAGTTCC CGGGCATCGG GCACGGCGAG 
ATCGCGCTCA CCGCCCTGCC GGACGTGCTG AGCTTCTTCG CCGCGGTGCG GGCCGGCTCG 
ACCCCGGCCA GCACCTGTTA G

Protein sequence

MNPRSRWIAA LATAGLLLGG CAQSTDSRLE QGALEEATEQ SFYALPDPIP AGGPGEVVRT 
EQLQSAPAGT IAWRVMYHST DVTGASILTS AVVIAPTAPW PGGGPRPVVA WGHPTTGMAG 
HCAPSTGVDP FDLIEGMTDL LNAGYAVAAA DYPGMGVAGP DAYLVGVSEG NSVLDAVRAA 
QHIEQTGATA AGDVLLWGHS QGGHAVLFAA QQAAGYAPEL KVRAAAVAAP ATELGALLND 
DIGDVSGVSL GSYAFQTYQS VYGPSIPGMS LTQVLTDAGA AATPQMAALC LIGQNSELHA 
IAGPLVGQYL RSDPTTTAPW SDILAQNTPG GVPITVPLLV AQGEADELVH PAATQQFVTQ 
QCAKAAHVIF KQFPGIGHGE IALTALPDVL SFFAAVRAGS TPASTC