Gene Namu_1403 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1403
Symbol
ID	8446999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	1553707
End bp	1554681
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	70%
IMG OID	645040534
Product	Substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_003200793
Protein GI	258651637
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1732] Periplasmic glycine betaine/choline-binding (lipo)protein of an ABC-type transport system (osmoprotectant binding protein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	0.619701
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.504767
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATGC GCACCGGCCG CCGACGCGGC CTGTTCCGAA CCGCCGGCCT GCTGGCGGCC 
GGCCTGGCCG CCGCCCTGAC CATCTCGGCC TGCGGCGGCG GTTCGTCCAA CCCGCTGGAC 
ACCAGCACCT CGGCCGCGGC ATCCGGACCC GCGTCCGGAT CGGCGGCCGC CGGCGGCGGC 
AAGATCGTCG TCGGCTCGGC CAACTTCCCC GAGAGCGCGC TGCTGGCCAA CATCTACGCC 
GCGGCGTTGA CCAAGGCCGG CCTGGACGCC TCGACCAACC TGAACATCGG CAGCCGCGAG 
GTCTACATCA AGGCCATCCA GGACGGGTCG ATCGATCTGG TGCCCGAGTA CTCCGGGGTG 
CTGCTGCAGT ACTTCGATCC GACCGCCACC GCGGTCTCGG CCGACGACGT CTATGCGGCG 
CTGGTCAAGG CCACGCCGCA GGGCCTGGTC GTGCTGGAGA AGTCGGCGGC CGAGGACAAG 
GACGCGGTGG TGGTCACCAA GGCCACCGCG GAGGCCAACA ACCTCACGTC CATCGCCGAC 
CTCGCCCCGG TCGCCTCCAC GTTCATCCTG GGCGGACCGT CCGAGTGGGA GACCCGGCCC 
ACCGGCGTGC CCGGGCTCAA GGAGAAGTAC GGCCTGACCT TCAAGGAGTT CAAGGCGCTG 
GACGCGGGCG GACCGCTGAC CCTCAACGCG CTGCTCAGCG ATCAGGTTCA GGCGGGCAAC 
CTGTTCACCA CCGACCCGGC CATCCCGGCC AACGATCTGG TCGTGCTGGA GGATCCGAAG 
AATCTGTTCG CCGCGCAGAA CGTGCTGCCG TTGATCCGGT CGGACGCCAA CAACGCGCAG 
GTCACCGAGG CGCTCAACGC GGTGTCGGCC AAGCTGGACA CGGCCACGCT GACCGAGCTG 
CTGACCAAGG TCGCCGTGGA CAAGCAGGAC TCCGCGCAGG TCGCCCAGGA GTGGGTGGCC 
CAGAACCTGA GCTGA

Protein sequence

MTMRTGRRRG LFRTAGLLAA GLAAALTISA CGGGSSNPLD TSTSAAASGP ASGSAAAGGG 
KIVVGSANFP ESALLANIYA AALTKAGLDA STNLNIGSRE VYIKAIQDGS IDLVPEYSGV 
LLQYFDPTAT AVSADDVYAA LVKATPQGLV VLEKSAAEDK DAVVVTKATA EANNLTSIAD 
LAPVASTFIL GGPSEWETRP TGVPGLKEKY GLTFKEFKAL DAGGPLTLNA LLSDQVQAGN 
LFTTDPAIPA NDLVVLEDPK NLFAAQNVLP LIRSDANNAQ VTEALNAVSA KLDTATLTEL 
LTKVAVDKQD SAQVAQEWVA QNLS