Gene Namu_4021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4021
Symbol
ID	8449640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4436930
End bp	4437982
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	75%
IMG OID	645043066
Product	transcriptional regulator, LacI family
Protein accession	YP_003203302
Protein GI	258654146
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.613602
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.127498
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGGCG CGACGGGTGG GGCCGCCGAC GATGTCGGCG TGCGCCGTGG CGCGCCCACG 
CTCGAGGACG TGGCCAGCGC GGCCGGGGTG TCCCGGTCCA CCGCGTCCCG GGCGATCAAC 
GGCGAGGCCA AGGTCAGCCC CCGCGCGCGG GCCGCGGTCG AGGCGGCCGT GCTCCAGCTC 
GGGTTCACCC CCAATCAGGC GGCTCGCACC CTGGTCACCC AACGGACCAA TGCGGTCGCC 
CTGGTGGTGC CCGAGCCCGA CGAGCGGGTG GTGGCCGACC CGTTCTTCTC CGCCGCCGTG 
CAGGGCCTGT CCCAAGCTCT GGCCGACTCC GACCTGCAGT TGGTGTTGTT GATGGCCGGC 
CTGGCCGGCT CACCGGAACG GGCCGTGCAC TACCTGCGGC ACGGGCACGT CGACGGCGCG 
GTCGTGGTGT CCCACCACCA GGCCGACGAC ATCGAGCGGG TGCTGGTCGC CTCGGGGATG 
CCCAGCGTGT TCGTCGGCCG CCCCTGGAAC CTGCCGGACC AGCTGCATTA CGTGGACACC 
GACAACCGGC GGGGCGGCGA GCTGGCCACC GAGCATCTGA TCGCCCGGGG CCGCCGGCGC 
ATCGGCACGG TCGCCGGCCC GGCGGACATG ACCGCCGCCT ACGACCGGCT GGCCGGCTGG 
CGATCGGCCC TGGCCGCGGC CGGGCTGCCG GCCGACGCGG TCGAGTACGG CGACTTCACC 
ACCGAGGGCG GCGCAGCGGC GATGCGGCGG CTGCTGGCCC GCCGGCCCGA CCTGGATGCG 
GTGTTCGTGG CCTCGGATCT GATGGCCGCC GGCGCGCTGG CCGTGCTGCG GGCGGCCGAG 
CGGAGCGTGC CCGGCGACAT CGCCGTCGTC GGCTACGACG ACTCAGCGGT CGCCGCCGTC 
ACCGACCCGC CGCTGACGAC GGTGATCAAC CCGGTGGCCA CGATGGCCCG GACGGCGGGC 
GGCATCCTGC AGCGGTGGCT CACCGACCCG GAGCCGCCCG ACCGCGGGCC GGTCGTCTTC 
CCGCCCGAGA TGGTCGTCCG GACGTCCGCC TGA

Protein sequence

MRGATGGAAD DVGVRRGAPT LEDVASAAGV SRSTASRAIN GEAKVSPRAR AAVEAAVLQL 
GFTPNQAART LVTQRTNAVA LVVPEPDERV VADPFFSAAV QGLSQALADS DLQLVLLMAG 
LAGSPERAVH YLRHGHVDGA VVVSHHQADD IERVLVASGM PSVFVGRPWN LPDQLHYVDT 
DNRRGGELAT EHLIARGRRR IGTVAGPADM TAAYDRLAGW RSALAAAGLP ADAVEYGDFT 
TEGGAAAMRR LLARRPDLDA VFVASDLMAA GALAVLRAAE RSVPGDIAVV GYDDSAVAAV 
TDPPLTTVIN PVATMARTAG GILQRWLTDP EPPDRGPVVF PPEMVVRTSA