Gene Namu_3961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3961
Symbol
ID	8449580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4371040
End bp	4372044
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	72%
IMG OID	645043006
Product	transcriptional regulator, LacI family
Protein accession	YP_003203242
Protein GI	258654086
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0946705
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGCGCA AGCCGACGAT GAACGACGTG GCGCACCGTG CCGGCGTCGC GCTGAAGACC 
GTCTCCCGGT ATGTCAACGG CGACCCGACG ATCGGTGCGG ACTATGCCGA CCGCATCCGG 
GAGGCGATCG CGGAACTGGG CTACCGGCGC AACATGGCCG CCGCCCGGAT CCGGCCCGGG 
CAGAGCGCGA AGATGATCGG GCTGATCATC AGCGACCTGT CCAACCCCTA CTTCGCGACC 
CTGGCCCGGG CCATCGAACT GGGGGCCGCC GCGGCCGGCT ACATGCTGAC CATCGCCAGC 
TCGGAGGAGG ACGGAGCGCG GCACGACCTG CTGGTCGACC GGCTGCTGGA GCAGCAGGTG 
GACGCGATCA TCGACGTCCC GCCGCGCGCG CCGGGCCGGG CCTGGCGGGA CATCCCGCCG 
CCGCTGCCGC CGCTGGTGTT CGTCGACCGG CCGTCCGACT GGGCCGCTGC CGATACGGTG 
CTGGCCGACA ACGCCGGAGG TGCCCGGTCT GCCACCCGGG CGTTGCTGCA CGCCGGTGCC 
GGCACCGTCG CCTTCGTCGG CGACTCGGTG GAGATCTTCA CGATGGGGGA GCGGCTGACC 
GGCTACCGGC AGGCCCTGGT CGAGGCCGAC CGGCCGGTCG ACGACGACCT GGTGCGGGAC 
ACCGTGCACA CGGTCGACGA CGCGATGCGG GTGGTGCTCG ATCTGCTCGC GGGCGGACGG 
GCGCAGGCGG TGTTCGCGGC CAACAACCGC GCCGCCCTGG GCGCGTTGCG CGCCTTCCGG 
TTGGCCGAGA CGTTCCTGCC GATGATCGGC TTCGACGAGT TCGAGGCCGC CGCGCTGATC 
AACCCGCCGA TCTCGGTGGT CAGCCAGGAC ATCCAGGCGA TGGGCAGGGC CGCCGCCGAC 
CTCGCCGTGG CCCGGCTCAA CGGGAGCGAT ATCCCCTGCA CCACCACGGT TTTGCCGACG 
TCGCTGATCC TGCGGGGGTC GGAACGGCTG CTCCCGGCGT TCTGA

Protein sequence

MQRKPTMNDV AHRAGVALKT VSRYVNGDPT IGADYADRIR EAIAELGYRR NMAAARIRPG 
QSAKMIGLII SDLSNPYFAT LARAIELGAA AAGYMLTIAS SEEDGARHDL LVDRLLEQQV 
DAIIDVPPRA PGRAWRDIPP PLPPLVFVDR PSDWAAADTV LADNAGGARS ATRALLHAGA 
GTVAFVGDSV EIFTMGERLT GYRQALVEAD RPVDDDLVRD TVHTVDDAMR VVLDLLAGGR 
AQAVFAANNR AALGALRAFR LAETFLPMIG FDEFEAAALI NPPISVVSQD IQAMGRAAAD 
LAVARLNGSD IPCTTTVLPT SLILRGSERL LPAF