Gene Namu_2107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2107
Symbol
ID	8447718
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	2324785
End bp	2325795
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	68%
IMG OID	645041230
Product	inner-membrane translocator
Protein accession	YP_003201474
Protein GI	258652318
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0000157987
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.126352
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCGT CTGCCGTGAC CCCGCCGCCG GCGCCGGCGG TCGCCCCGGC CGAGCCCCGC 
GTACCCACCG CGACCAGGGT GATCGGCTGG ATCGCCACCA ACGGCATCTT CGTCTTCACC 
GTCGTGCTCG TGGTGGGCGC ATCGCTGCTG GTCGACGGAT TCGCCTCGGC CACCAACATC 
GGCGATGTGT TCCATCGGGC CGCGCCGATC GGCATCGTCG CCGTCGGCAT GACCTTCGTC 
GTGATCAGCG GCAACTACCT GGACCTGTCC GTGGTTGCCC AGGTCGCCAC GGCGGCGGTC 
ATCCTCATCG GGGTCAGCAA TGGCCACGGG ATCGGGCTGG CGATCCTGGC CGCGCTGGTC 
GTGGCCGGGC TCTATGCCCT GGTCAACGGG GTGGCGGTGG GGTATTTCAA GGCCAACGCG 
GTGATCGTCA CCCTGTCCAC CACCTATATC GGTCTGGGCG TGCTGCGCTG GCTTTCCGGT 
GGGAGCATCT TCTTCGGCCC GCCCGACGGC CCGATCGCCA CCTTCGGCGA CATCAAGGTG 
GGGCCGGTGC CGATCTCGGC CGTGGTACTG CTGCTGATGG CCGGGGTGCT CGGATTCGTG 
TTGAGCCGCA CCACCTTCGG TTTCGTGATC CGCTCGTTCG GGTCGAACAA GGAGGCCACC 
AGGCTGGCCG GAGTGGCCAC CGGTCGGGTG GTGCTGGGCG CGTTCCTGAT CACTTCGATC 
TCGGCGATGG TGGCCGGCTT CGTGCTGGCC GCGTTCTCCA ACACGGCGGT GTCCTCGATG 
TCGCAGGGCT ACGACTTCGG TGCCCTGGCC GCCATCATCA TCGGCGGCAC CAGCGTGTTC 
GGCGGCCGGG GCAGCGTGTT GCGCACGCTG CTCGGGGTGA TCTTCGTCAG CGTGCTGACC 
AACATCCTGG TGCTCGCGAA CCTGAGCTAC GGCTGGCAGC AGGTCGTGAT CGGGTCCCTG 
ATCGTGCTGG CTGTTTCGGT GGACGCGCTG GCCCGGCGGG TGAGCGCATG A

Protein sequence

MTASAVTPPP APAVAPAEPR VPTATRVIGW IATNGIFVFT VVLVVGASLL VDGFASATNI 
GDVFHRAAPI GIVAVGMTFV VISGNYLDLS VVAQVATAAV ILIGVSNGHG IGLAILAALV 
VAGLYALVNG VAVGYFKANA VIVTLSTTYI GLGVLRWLSG GSIFFGPPDG PIATFGDIKV 
GPVPISAVVL LLMAGVLGFV LSRTTFGFVI RSFGSNKEAT RLAGVATGRV VLGAFLITSI 
SAMVAGFVLA AFSNTAVSSM SQGYDFGALA AIIIGGTSVF GGRGSVLRTL LGVIFVSVLT 
NILVLANLSY GWQQVVIGSL IVLAVSVDAL ARRVSA