Gene Namu_3971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3971
Symbol
ID	8449590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4383266
End bp	4384318
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	68%
IMG OID	645043016
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_003203252
Protein GI	258654096
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.182523
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0264597
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCGTT CCAAGGTCCT CACTGCCACC GCGGTCGGCG CGTTCGCCGT CATGCTCACC 
GTGGCGGGCT GCTCGTCCTC CAAGCCGGAA TCCAGCGCGG GCACCTCGGC CGGTTCGGGC 
TCGGCCGCGG CGGCCACCGC CAGCGCCGCG ACCGGGTCGG TGGCCGCGCC GACCAAGGCC 
GGCAAGGACT ACAACGTGGC GTTCATCCAG GGTGTCGCCG GCGACGAGTT CTACATCACC 
ATGCAATGCG GCATCGAGGC CGAGGCGGCC AAGCTGGGCG TCACGGTGAA CACGCAAGGC 
GGCCAGAAGT TCGACCCGAC GCTGCAGACC CCGATCCTGG ACTCGGTCGT GGCCAGCAAG 
CCCGACGCGA TCCTGATCGC GCCGACCGAT GTCACCGCCA TGCAGAGGCC GCTGGAGAAC 
GCGGCCGCCG CCGGCATCAA GGTCGTCTTG GTCGACACCA CCACCGAGGA CCCGTCGTTC 
GCCGTCTCCC AAGTCTCCTC GGACAACGAA GGCGGCGGCG CCGCCGCGTT CAAGGCCATC 
AAGGACAAGA ACCCCAACGG CGGCAAGGTG CTGGTCATCT CCACCGACCC CGGCATCTCT 
ACCGTCGACG CCCGGGTGAA GGGCTTCGAG GACGCGGTCG GCAAGGATTC CACGTTCGAC 
TACCTGGGCG TGCAGTACTC GCACAATGAC CCGGCCACGG CCGCCCAGCT GGTCACCGCG 
GCCCTGCAGA AGGACCCCGA CATCGTCGGC ATCTTCGCCA CCAACATCTT CTCCGCGGAG 
GGCTCGTCCA CCGGCGTCAA GCAGGCCGGC AAGAGCGACC AGATGACGAT CGTCGGCTTC 
GACGCCGGCC CGAACCAGGT CAAGGCGCTC AAGGACGGCA CCGTCCAGGC GCTGGTCGCG 
CAGCAGCCCG CCACCATCGG CACCGACGGG CTGGATCAGG CGATCGCCTC GCTCGACGGC 
GGCACCATCA CCCCCAAGAT CCAGACCGGC TTCACCATCA TCACGGCCGA TAACGTCGAC 
TCCTCGGATG CGGTCTACAA GTCCTCCTGC TGA

Protein sequence

MKRSKVLTAT AVGAFAVMLT VAGCSSSKPE SSAGTSAGSG SAAAATASAA TGSVAAPTKA 
GKDYNVAFIQ GVAGDEFYIT MQCGIEAEAA KLGVTVNTQG GQKFDPTLQT PILDSVVASK 
PDAILIAPTD VTAMQRPLEN AAAAGIKVVL VDTTTEDPSF AVSQVSSDNE GGGAAAFKAI 
KDKNPNGGKV LVISTDPGIS TVDARVKGFE DAVGKDSTFD YLGVQYSHND PATAAQLVTA 
ALQKDPDIVG IFATNIFSAE GSSTGVKQAG KSDQMTIVGF DAGPNQVKAL KDGTVQALVA 
QQPATIGTDG LDQAIASLDG GTITPKIQTG FTIITADNVD SSDAVYKSSC