Gene Namu_1772 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1772
Symbol
ID	8447374
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	1942767
End bp	1943927
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	69%
IMG OID	645040898
Product	ROK family protein
Protein accession	YP_003201151
Protein GI	258651995
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.415249
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.404833
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAGC GGACCGAGTC CTTTCCAGCC CTGTCCGAGG GCTCCCGGGC CGCGCTCGTC 
CGGCTGCTGG TCCATGGCCC GGCGTCCCGG GCCGATCTGG CCCGGCGGCT TCGTCTCTCA 
CCCGCGAGCC TGACCCGGAT CGTGCGCACG CTGGAGGACA GCGGCCTCGT GGTGGAGTCC 
GAGACCACCG TGCCGCAGCG GATGGGTCGC CCGTCCCAGG CGATGGAAGT CAACGTTGAC 
GCCGTCCACC TCGTCGGCAT CAAGCTCCTG GCCGGCGAGA TCAATCTGGT TCGCACCGAC 
ATGCGCAGCA CGGTGCTCGG CCACCGGACC ATCCCTCTGC AGACCGTCCC GCTGGATCCG 
GCCATCGACC GGATCACCGA AGCCATCCTG GCCGAGGTGG CGGTCGATCC GGCCGTCGGA 
GCAGTGGGGA TCAGCCTGGC CGGGCCGGTG GATCCCAGTT CGGACATGGT CACCCACTCC 
CCTTTTCTCG GCTGGGAGGA CGTACCCCTG GCTCGCTTGG TCAGCGAGCG AACGGGATTG 
CCCACCGTGA TCGAAAATGA CGTGCGGGCG CTGACCGCCG CCGAGCATTG GTTCGGCGCA 
GCCGCGGGCG CAACCGATTT CGTCTTGGTC ACCATCGGCG CGGGCATCGG CTGCGGGGTC 
GTGATCGGTG ACCGGTTGGT TGACGGCAAC ACCGGTGGCG CAGGCCAGAT CGGGCACCTG 
CCGATCACCC CGTCCGGGCC GTTGTGCGAA CGTGGTCATC GCGGCTGCGC CCGGTCGTAC 
TTGGCGTCCT CGGCGATGGT CGGACAGGCG TCCATGGCCC TGCACCGGCC CGATCTCACC 
TATGCCGAAC TCGTGTCGTT GGCCCACCAG GGCGAGCGGG TCGCCAGCCG GGTCGTGCGG 
GATGCCGGCT ACGCGTTGGG CACCCTGATC GGACTGGTGA CCGCGATCAC CGCGCCCAGC 
AAGGTGATCA TCTCCGGTGA GGGGGTCACG ATGGTCCCGC TGGTCATGGA CGTCGTGCAG 
GAGCGGGCCA GCGAGGTCGA ACACTGGGCC GTGCCCGATG TTCCCATCGA GATTGCCGAA 
TTCGGCTTCG TGGAATGGGC CCGCGGCGCT GCCGTCATTG CCCTGCAGCA ACTACTGGAA 
GCGGCCATTA GCCCCGCCTG A

Protein sequence

MSERTESFPA LSEGSRAALV RLLVHGPASR ADLARRLRLS PASLTRIVRT LEDSGLVVES 
ETTVPQRMGR PSQAMEVNVD AVHLVGIKLL AGEINLVRTD MRSTVLGHRT IPLQTVPLDP 
AIDRITEAIL AEVAVDPAVG AVGISLAGPV DPSSDMVTHS PFLGWEDVPL ARLVSERTGL 
PTVIENDVRA LTAAEHWFGA AAGATDFVLV TIGAGIGCGV VIGDRLVDGN TGGAGQIGHL 
PITPSGPLCE RGHRGCARSY LASSAMVGQA SMALHRPDLT YAELVSLAHQ GERVASRVVR 
DAGYALGTLI GLVTAITAPS KVIISGEGVT MVPLVMDVVQ ERASEVEHWA VPDVPIEIAE 
FGFVEWARGA AVIALQQLLE AAISPA