Gene Namu_4271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4271
Symbol
ID	8449897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4750872
End bp	4751921
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	76%
IMG OID	645043319
Product	transcriptional regulator, LacI family
Protein accession	YP_003203548
Protein GI	258654392
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.189844
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGGCT CCCGGGCGAC CCTGGCCCAG GTCGCGGCCC GCGCCGGCGT CTCGGTCTCG 
ACCGCCTCGC TGGCCTTCAG CGGGTCCGGC CCGGTGTCGG CGGCGACCCG CGAGCGGGTG 
CTCGCCGCGG CCGAGCAACT GCGCTACGCC GGTCCCGACC CGCGGGGCCG CTCCCTGCGG 
CAGGGCCGCT CCGGGATCAT CGCGGTGGTC ATGGAGGACC GGGTGCTGGC CGCCTTCCGC 
GATCCGGTGC GCATCGCCGT GCTCGACGGG ATCGCCCAGG AGACCTCGGC CCAGGGCCAG 
GGGCTGCTGC TGCTCTCCGA CGTCGGGGAG AGCGCGGACG CCATCGGCAC CGCCACCATG 
GACGCGGCCA TCCTGCTGGC CTTCAGCTAC CGCAGCGACC CCACGGTCGA ACTGCTGCGC 
CGCCGGGTGG TCCCGCTGGT CGCCCTGGGC GGCCCCGACC ACGGCCTGCT GACCATCTCC 
ATCGACGACG AAGCGGCCAG CGCGGCGGCG GCCGCCCACC TGGCCGGCCT GGGCCACACC 
GACGTCGCGA TCGTGACGCT GCCGCTGGTC AACGTGGATT CGCCGGCGGC CCGCGGGCCA 
CTCACCGCCG ACGCGATGCG CGCCGCCTCA GTGACGGTCT CGCTCACCCG GCTGCGCGGC 
GCCCGGTCGG TCTTCCCGGC CGCCGCGGGC TGGGTCAGCG CGGCCAGTTC GGTCGACGAG 
GGCATGATCG CCGGGCAGGC GCTGCTGGCC GATCCCGCGC GCCGGCCCAC GGCGGTGATC 
GCGCAGAGCG ACCTGCTGGC CGCCGGCGTC ATCCGGGCCG CACACGAGCT CGGCCTGTCC 
GTGCCGGGCG AGCTGTCGGT GATCGGGTTC GACGGGATCC CGCTGGACCG GATCATCCCG 
CAGGACCTGA CCACGATGGT GCAACCGGCC GCCGCCGAGG GCCGGGCCGC CGGTCGCGCC 
GTGCTGGACC TGCTGGCTGG GGAACACCCC CGGTCCACCA GCTTCCAGTG CACGTTCCAC 
CCGGGCGCCA CCACCGCCCG CCCCGCCTGA

Protein sequence

MSGSRATLAQ VAARAGVSVS TASLAFSGSG PVSAATRERV LAAAEQLRYA GPDPRGRSLR 
QGRSGIIAVV MEDRVLAAFR DPVRIAVLDG IAQETSAQGQ GLLLLSDVGE SADAIGTATM 
DAAILLAFSY RSDPTVELLR RRVVPLVALG GPDHGLLTIS IDDEAASAAA AAHLAGLGHT 
DVAIVTLPLV NVDSPAARGP LTADAMRAAS VTVSLTRLRG ARSVFPAAAG WVSAASSVDE 
GMIAGQALLA DPARRPTAVI AQSDLLAAGV IRAAHELGLS VPGELSVIGF DGIPLDRIIP 
QDLTTMVQPA AAEGRAAGRA VLDLLAGEHP RSTSFQCTFH PGATTARPA