Gene Namu_5149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5149
Symbol
ID	8450780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5737729
End bp	5738769
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	71%
IMG OID	645044183
Product	transcriptional regulator, LacI family
Protein accession	YP_003204407
Protein GI	258655251
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	60
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTGACC CCAGGGTTCA GACGGTCGGA ATCATGGAAG TGGCCGCACT CTCCGGGTTT 
TCCCCCGCAA CCGTGTCACG CGCGTTGCGG GGGTTGCCCG GGGTGTCGAC CAAGACCAGG 
GAGGCGGTCG AGCGAGCCGC CGCCTCCCTG GGTTATGCCC CCTCGCCCTG GGCGACCGCG 
CTGACCACCG GGCGCACCAA TGCGATCGCG GTGATCGCGC CGTGGGTGTC CCGATGGTTC 
TTCTCGGCCG TGATCGAAGG CGTGCAGGAG GTCCTGTCCG CCTGCGGCTA CGACCTGATG 
CTGTATCCCT TCGGCGTCGA CGGCGAGCTC GACGCCCGGG CGTTGACCAA GCGGGTGGAC 
GGCGTGCTCG CGCTCAACGT GCCGCTGGCC CACCGGGCGA TCGAGGGCCT GGACGACCTG 
GGTGTCCCGA TCGTCACCGT CGGCACCGCC ATGGAGGGCA TCTCCGCGGT GCTGGTGGAC 
AACGTCGCGG TCGGCCGGCA GGCGACCCAG CACCTGCTGG ATCTCGGCCA CCGGCGGATC 
GCGTTCTTCG GGTCCGAGAC CGAGGAGAAC CGCCGGTTCA CCGTCGCCTC CGATCGTCAG 
CGCGGGTACC ACGACGCGCT GCGCGCGGCC GGGATCGAGC CCGACCCGGA GCTGTCGTTC 
CCGACCGACT TCTCGATCAA CGGTGGAGAG GCGGCGCTGC ATCGCAGCGT CGGCCGGTTC 
GGCCCGTCCG CCGACCGGCC CACCGCCGTC TTCGCGGTCA GCGACGAGGT GGCCATCGGC 
GGCCTGCACG CCGCCCGCCT GCACCAGATC CAGGTGCCCA AGGACATGTC CTTCATCGGG 
GTCGACGGGC ATGACTTCGC CTACCTGTTC GACCTGAGCA CGATCAGTCA GCCGGTGCGC 
GACCAGGGTC GGATCGCCGC GCGGCTGTTG CTGCAGCAGG TCAACGATCC CGGCGCCGGC 
CCGACCGCGG TCAACGTCGG CTGCGAACTG ATCCGTCGCG CCTCCACCGG GCCGGTCGGC 
GGTGGGGCGC CCCGCTCCTA G

Protein sequence

MADPRVQTVG IMEVAALSGF SPATVSRALR GLPGVSTKTR EAVERAAASL GYAPSPWATA 
LTTGRTNAIA VIAPWVSRWF FSAVIEGVQE VLSACGYDLM LYPFGVDGEL DARALTKRVD 
GVLALNVPLA HRAIEGLDDL GVPIVTVGTA MEGISAVLVD NVAVGRQATQ HLLDLGHRRI 
AFFGSETEEN RRFTVASDRQ RGYHDALRAA GIEPDPELSF PTDFSINGGE AALHRSVGRF 
GPSADRPTAV FAVSDEVAIG GLHAARLHQI QVPKDMSFIG VDGHDFAYLF DLSTISQPVR 
DQGRIAARLL LQQVNDPGAG PTAVNVGCEL IRRASTGPVG GGAPRS