Gene Namu_1814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1814
Symbol
ID	8447419
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	1989657
End bp	1991225
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	67%
IMG OID	645040943
Product	permease for cytosine/purines uracil thiamine allantoin
Protein accession	YP_003201193
Protein GI	258652037
COG category	[F] Nucleotide transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG1953] Cytosine/uracil/thiamine/allantoin permeases
TIGRFAM ID	[TIGR00800] NCS1 nucleoside transporter family

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.627915
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.010101
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACA AGCAGGTGAC CGACACCCCC GTCGCGGGAG CAGTCGCCGA GCACCATCAT 
CTGTCCATGC ACGACATCAC CCCGGACCAT CCCGCCGGCG CGGGGGTGAT CAAGCCCGGT 
TACGACGACC GGCTCACCAA CGAGGACCTG GCCCCGCTGC GCAAGCAGAC CTGGGGTTCC 
TACAACTTCT TCGCTTTCTG GATGTCCGAC GTGCACAGCG TCGGCGGGTA CGTCACCGCG 
GGCAGCCTGT TCGCCCTGGG CCTGGCCGCC TGGCAGGTGC TGGTCGCCCT GCTGGTCGGC 
ATCACCATCG TGTATTTCCT GTGCAACCTG GTGGCCCGGC CCTCGCAGGC CACCGGCACT 
CCCTACCCGG TCGCCTCCCG GATCTCCTTC GGCGTGCTCG GGGCGAACAT CCCCGCGATT 
ATCCGCGGCC TCATCGCGGT GGCCTGGTAC GGCATCCAGA CCTACCTGGC CTCGGTGGCG 
CTGGTCCTGC TGGCGATCAA GCTCTGGCCC GGGCTCGCGC CCTACGCCGA GACCGCGCAG 
CACGGTTTTG CCGGGTTGTC GCTGCTGGGC TGGATCGGCT TCATGATCAT GTGGGTCGCC 
CAGGCCGTCG TCTTCTGGCG GGGCATGGAG GCCATCCGCA AGTTCATCGA CTTCTGCGGA 
CCCGCCGTGT ACGTGGTCAT GTTCGCGCTG GCCATCTACC TGGTCGCCGC GGCCGGCTGG 
GAGAACATCG ACTTCAACCT GGCCGAGGGC GGCTTGACCC TGACCGGCTG GGCCGTCATC 
CCCGTGCTGC TGTCCGCGAT CGCCCTCGTC GTCTCCTACT TCTCGGGCCC GATGCTGAAC 
TACGGCGACT TCGCCCGCTA CGGCAAGTCG TTCGGCGCGG TCAAGAAGGG CAACTTCCTG 
GGTCTGCCGG TCAACTTCCT GGTCTTCTCG CTGCTGGTCG TGGTGACCGC GGCGGCCACC 
CGGCCGGTGT TCGGCGAGCT GATCATCGAT CCGGTGCACA CCGTGGCCCG GCTGGACAAC 
GTCTACGCCG TCATCCTGGG CGCGCTGACC TTCATGATCG CCACCGTCGG CATCAACATC 
GTGGCCAACT TCGTCTCCCC CGCCTTCGAC TTCTCCAACG TCAACCCGCA GAAGATCTCC 
TGGCGGATGG GCGGCATGAT CGCCGCGATC GGCTCCGTGC TGATCACCCC GTGGAACCTG 
TACAACTCGC CGCAGACCAT CCACTACACG CTGGACATCC TGGGCGCCTT CATCGGCCCG 
CTGTACGGCG TCCTGATCGC CGACTACTAC CTGGTCAAGC GGCGTCGGGT GAACGTGGAC 
GCGCTGTACA CCCTGAGCCC GAACGGCACC TACCACTACC GCAAGGGCTA CAACCCGGTC 
GCCGTCGTGG CCACCGCGGT CGCCGCCCTG GCCGGTGTGC TGGTCGTCTT CTTCGCCTCC 
ACCGAGGCCG CGACCTACAC CTGGTTCATC GGCGCCGGGC TGGGCTTCGT CCTCTACATG 
GTCGGCAGCA AGCTGTTCTC GGTGCAGGCC AACTACCCGA CGGCCGAGCA GATGGGCACC 
GCCGCCTGA

Protein sequence

MTDKQVTDTP VAGAVAEHHH LSMHDITPDH PAGAGVIKPG YDDRLTNEDL APLRKQTWGS 
YNFFAFWMSD VHSVGGYVTA GSLFALGLAA WQVLVALLVG ITIVYFLCNL VARPSQATGT 
PYPVASRISF GVLGANIPAI IRGLIAVAWY GIQTYLASVA LVLLAIKLWP GLAPYAETAQ 
HGFAGLSLLG WIGFMIMWVA QAVVFWRGME AIRKFIDFCG PAVYVVMFAL AIYLVAAAGW 
ENIDFNLAEG GLTLTGWAVI PVLLSAIALV VSYFSGPMLN YGDFARYGKS FGAVKKGNFL 
GLPVNFLVFS LLVVVTAAAT RPVFGELIID PVHTVARLDN VYAVILGALT FMIATVGINI 
VANFVSPAFD FSNVNPQKIS WRMGGMIAAI GSVLITPWNL YNSPQTIHYT LDILGAFIGP 
LYGVLIADYY LVKRRRVNVD ALYTLSPNGT YHYRKGYNPV AVVATAVAAL AGVLVVFFAS 
TEAATYTWFI GAGLGFVLYM VGSKLFSVQA NYPTAEQMGT AA