Gene Namu_3431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3431
Symbol
ID	8449046
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	3772025
End bp	3773062
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	69%
IMG OID	645042507
Product	inner-membrane translocator
Protein accession	YP_003202747
Protein GI	258653591
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.00119664
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.000332917
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCGATC GAACCGCGAC CGATCAATCC GCCCGCCCCG AGAACTCCGT CCGCAGCGTC 
GATGTGGCTC CGGCGCCGGC CGCCGACCGC CGACGCTGGC GGGTCATCGA CCTGTGGGCC 
ACCGTCGGCC CGCTGACCGT GTTCGTCATC CTGTTCGCGC TGGTGGCGAT CCTGCGGCCG 
GCCTTCCTCG GCGGCGGCGG CCTGTCCATC GTGGCCACCC AGTGCACCGC GATCCTGCTG 
GTCGCCCTGG GCCAGTGCCT GGTGCTCAAC GTGGGCTCGA TCGACCTGTC CAACGCGGCG 
ATCGCGCTGT TCTCGGCGAT CCTGCTGGCC AAGACGATCG GCCCGGCCGG GGCCGGCGGG 
CTGGTCCTGG TGATCGTGCT CGGCGCGGCC ATCGGTGCGC TCAACGGGTT CCTGGTCTCG 
TTCTTCCAGG TGCCCAGCTT CGCCCTGACC CTGGGCACGC TGGGCATCCT GCAGACCGCG 
TCGCTGATCA TCAGCGACAA GACCACCGTC TACGCGGCCA AGAGCGCCCT GCTCACCCCG 
ATGTTCGGCT CGGCGATCGG CGGGCTGGTC ACCGCCTTCT GGACCGCGGT GATCATCGCC 
ATCGTGCTCT GGGCGATGCT GCGTTTCACC ACCCTGGGCC AGAGCATGAC GGCGGTCGGG 
CTGAACGAGA CCGGCGCCCT GTTCTCGGGC ATCCGGACCC GGGCCACCAA GATCATCGCC 
TTCATGTTCT CCGGACTGCT GGCCTCCATC GCCGGCGTCA TGATCATCGC CCAGGCGGGA 
TCGGCGTCCA GCACCGGCCT GGGCAGCGAC CTGCTGTTGC CCGGGATCAC CGCGGCGATC 
GTGGGCGGCA CGGCGATCAC CGGCGGCATC ACCAATCCCA TCAACGTCGT CTTCGGCGCC 
CTGACGGTCA CCCTGATTCC CGTCGGCACC GCGGCGATCG GCATCCCGTC CGAGGCGCAG 
AGCCTGGTCT ACGGCCTGGT GATCATCATC GCCGTGGCCC TGACCATCAG CCGCAAGCGC 
GTCGGCGTCG TGAAGTAA

Protein sequence

MSDRTATDQS ARPENSVRSV DVAPAPAADR RRWRVIDLWA TVGPLTVFVI LFALVAILRP 
AFLGGGGLSI VATQCTAILL VALGQCLVLN VGSIDLSNAA IALFSAILLA KTIGPAGAGG 
LVLVIVLGAA IGALNGFLVS FFQVPSFALT LGTLGILQTA SLIISDKTTV YAAKSALLTP 
MFGSAIGGLV TAFWTAVIIA IVLWAMLRFT TLGQSMTAVG LNETGALFSG IRTRATKIIA 
FMFSGLLASI AGVMIIAQAG SASSTGLGSD LLLPGITAAI VGGTAITGGI TNPINVVFGA 
LTVTLIPVGT AAIGIPSEAQ SLVYGLVIII AVALTISRKR VGVVK