Gene Namu_5348 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5348
Symbol
ID	8450981
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5984743
End bp	5985867
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	69%
IMG OID	645044379
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_003204601
Protein GI	258655445
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4213] ABC-type xylose transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	62
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCTGA AGTCCCCTGT CATGGTCGGA ATGGTGGCGG CCGGCGCGCT GCTGCTGGCC 
GCTTGTGGCT CCAGCTCCTC CTCATCGGGC ACCACCTCGG CGGCGGCCTC CGGGAGCGGC 
ACCAGTGCGG CGGCCTCGGG TTCGGCGGCC GGCGGCGCGA CCGGCAAGGT CGGCGTCATC 
CTGCCGGACA CCAAGTCCTC CGCTCGCTGG GAGACCCAGG ACCGGCCGGC GCTGGAGAAG 
GCTTTCCAGG CTGCGGGTGT CGAGTTCGAC ATCCAGAACG CCAACGGTGA CAAGGCGGCC 
ATGGCCACCA TCGCCGACCA GATGATCGCC AACGGGGCGA CCGTGCTGGC CATCGTGAAC 
CTGGACAACG AGTCCGGCGC GGCGATCGAG AAGAAGGCCG CCAGCCAGGG CGTGCAGACC 
ATCGACTACG ACCGGCTGAC CCTCGGCGGC GGCGCGGACT ACTACGTCTC GTTCGACAAC 
ACCGAGGTCG GCAAGCTGCA GGGCACCGGC CTGGCCAAGT GCCTGGGCAG CGGCGACAAG 
AAGATCGTCT ACCTGAACGG CTCGCCGTCG GACTCGAACG CGACCGCGTT CTCGGCCGGC 
GCGCACTCGG TGCTCGACCC GATGACCAAC TACACCGTGG TCGCCGAGCA GGCCGTGCCG 
GACTGGGACA ACCAGCAGGC CGGCGTGATC TACGAGCAGA TGTACACCGC GCAGGGCGGC 
AAGATCGACG GCGTGCTGGC GGCCAATGAC GGCCTGGGCA ACGCGGCCAT CGCGATCAAC 
AAGAAGAACG GCCTGCAGAT CCCGGTCACC GGGCAGGACG CCACCGTCCA GGGCCTGCAG 
AACATCCTGG CCGGCGACCA GTGCATGACG GTCTTCAAGG ACACCAACAA GGAGGCCGCG 
GCGCTGGCCA AGGTCGCCAT CGCGCTGGCC CAGGGCCAGA CCCCGCAGAC CACCGGCACG 
GTCAAGGACA CCACCGGCAA CCGGGACGTG GCCGCGATCC TGGAGACCCC GGAGGCCATC 
TACAAGGAGA ACGTCAAGGA CGTCGTCACG GCCGGCGGCA CCACCGCCGC CGAACTGTGC 
ACCGGCGCCT ACGCCGCCGC CTGCACCGAG CTGGGCATCA GCTGA

Protein sequence

MRLKSPVMVG MVAAGALLLA ACGSSSSSSG TTSAAASGSG TSAAASGSAA GGATGKVGVI 
LPDTKSSARW ETQDRPALEK AFQAAGVEFD IQNANGDKAA MATIADQMIA NGATVLAIVN 
LDNESGAAIE KKAASQGVQT IDYDRLTLGG GADYYVSFDN TEVGKLQGTG LAKCLGSGDK 
KIVYLNGSPS DSNATAFSAG AHSVLDPMTN YTVVAEQAVP DWDNQQAGVI YEQMYTAQGG 
KIDGVLAAND GLGNAAIAIN KKNGLQIPVT GQDATVQGLQ NILAGDQCMT VFKDTNKEAA 
ALAKVAIALA QGQTPQTTGT VKDTTGNRDV AAILETPEAI YKENVKDVVT AGGTTAAELC 
TGAYAAACTE LGIS