Gene Namu_1406 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1406
Symbol
ID	8447002
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	1556163
End bp	1557293
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	72%
IMG OID	645040537
Product	glycine betaine/L-proline ABC transporter, ATPase subunit
Protein accession	YP_003200796
Protein GI	258651640
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1125] ABC-type proline/glycine betaine transport systems, ATPase components
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.515015
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCAGCT TCGAATCGGT ATCCAAGATC TACCCGGACG GCACCCATGC CGTGGAGGAA 
CTCTCCCTGG AGATCGCGAC CGGCCGCATC ACGGTATTCG TGGGCCCGTC CGGCTGCGGC 
AAGACGACCT CGCTGCGCAT GATCAACCGG ATGATCGAGC CCACCCACGG CGTGCTGTCC 
ATCGACGGGC GGGACATCTC CACCGTCGAC GCCCCGGTGT TGCGGCGCGG CATCGGGTAC 
GTCATCCAGA ACGCCGGCCT GTTCCCGCAC CGCACAGTGC TGGACAACGT GGCCACCGTG 
CCGGTCCTGC AGGGCCGCAG CCGCCGGGAG GCCCGGCTGG CGGCGGCCGA ACTGCTGGAC 
CGGGTGGGCC TGGACCGCAA CCTGGCCAAG CGCTATCCGG CCCAGCTCTC CGGCGGGCAG 
CAGCAGCGGG TCGGGGTGGC CCGGGCCCTG GCCGCCGATC CGCCGGTGAT GCTGATGGAC 
GAGCCGTTCT CCGCGGTCGA CCCGGTGGTC CGCAACCAGC TGCAGGACGA GCTGATCCGG 
TTGCAGGCCG ATCTCGGTAA GACCATCGTG TTCGTCACCC ATGACATCGA CGAGGCGGTC 
AAGCTCGGCG ACCGGATCGC GGTCTTCGCG GTCGGCGGCC GGCTGGCCCA GTACGCCGAG 
CCGGCCGAGG TGCTCAGCCG GCCGGCGGAC GATTTCGTCG CCGACTTCGT CGGCCGGGAC 
CGCGGTTACC GCGCCCTGTC GTTCGTCACC GGCGACCTGC CGGTCCGGCC GGAGCAGACG 
CTGACCTTGG GCGCCCCCGT GCCTCGCGGG GCCGGCAGCG CCGCCGAGGG CATCTCCGCC 
GATCACGGGC GCTGGATCCT GGTGGTGGAC GACGACCGCC GGCCGCGCGG CTGGCTGGAC 
TGCGCGGCGG TCCCGGTCGG GCATCCGGTC GGGGTCGACG ATCTCGTGCT GGGCGGCTCG 
CTGGCCGCGC CGGACGGATC CCTGCGCCGG GCCCTGGACG CGGCGCTGTC CTCCCCGTCC 
GGGCGCGGCG TGGCGGTCGA TGCCGACGGC GCCGTAGTCG GCACCATCAC CGCCGCCGAG 
GTGCTGACCG CGATCGAGCA GTCCCGTGGT CCGGACAAGG TCACGACATG A

Protein sequence

MISFESVSKI YPDGTHAVEE LSLEIATGRI TVFVGPSGCG KTTSLRMINR MIEPTHGVLS 
IDGRDISTVD APVLRRGIGY VIQNAGLFPH RTVLDNVATV PVLQGRSRRE ARLAAAELLD 
RVGLDRNLAK RYPAQLSGGQ QQRVGVARAL AADPPVMLMD EPFSAVDPVV RNQLQDELIR 
LQADLGKTIV FVTHDIDEAV KLGDRIAVFA VGGRLAQYAE PAEVLSRPAD DFVADFVGRD 
RGYRALSFVT GDLPVRPEQT LTLGAPVPRG AGSAAEGISA DHGRWILVVD DDRRPRGWLD 
CAAVPVGHPV GVDDLVLGGS LAAPDGSLRR ALDAALSSPS GRGVAVDADG AVVGTITAAE 
VLTAIEQSRG PDKVTT