Gene Ndas_4604 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4604
Symbol
ID	9248485
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5460310
End bp	5461872
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	71%
IMG OID
Product	sodium/proline symporter
Protein accession	YP_003682496
Protein GI	297563522
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCTGGT CCGTCGCGAC CTTCGGCGTC TACCTCGCCG CCATGGTGGC CATCGGCCTG 
TGGGCCTACA AGCTCACTGT CTCGCAGTCG GACTTCGTGC TCGGCGGCAG ACAGCTCAAC 
AGCTGGGTGG CGGGTCTGAG CGCCAACGCC AGCGACTTCA GCGGGTGGCT GCTGCTCGGA 
CTGCCCGGCG CCATCTACGT CTCCGGTCTG GGCGAGGCCT GGATCGCGGT CGGCCTGGCC 
TGCGGCTTCG CCGGAAGCTG GATCCTCCTC GCGCCCCGCC TGCGCGTGTA CACCGAGCGC 
GTGACCGACG CCCGCTCGGG GGGCGACTCC GACTCCCTGA CCCTCTCCTC CTTTCTAGAG 
AACCGCTTCA ACGACCCCAC ACGGCTGCTG CGCGGGGTGT CGGCGGTGCT CATCATCGTC 
TTCTACTTCT TCTACGTCGC CTCCGGGCTC GTCGCCATGG CCGCCCTGTT CGACCAGGTC 
TTCGGACTGA GCCCGGGCCC CGCCATCGCC ATCGGCGTGG GCATCGTGGT GCTCTACACC 
GTGCTCGGCG GCTTCCTCGC GGTGTCCTAC ACCGACGTGG TGCAGGCGGC GATGATGTGG 
ATCGCCCTGC TGGCCGTCCC CGTCATGGCG GTCACCGCGC TCGGCGGTTT CGCCGGGCTG 
ACCGAGGGCG TGTCCGACAA GAGCGACGGG CTGCTGTCGG CCGTAGGCGG CACCGCCCTG 
GACGCCGAGC TCGGCCAGTG GGTGAGCACC GACACCCTCG GCTGGGTGGT CATCGTCTCC 
GGCCTGGCCT GGGGCTTCGG CTACTTCGGC CAGCCGCACA TCCTGTCCCG CTACATGGGC 
ATCCGCTCGG TCCGCGACAT CCCCAAGGCC GCCGTCATCA GCGTGGTCTG GGCGGTCACC 
GCCATGGCCC TGGCCGTGCT GGTCGGCTTC ATCGGCGTCG CCTACTTCGA CACCCCGCTG 
GAGAACTCCG AGCAGGTCTT CCCGCTCCTG ATCGAGGCCC TGACCCACCC GCTGGTCGCC 
GGTCTGCTGC TCGCCGCCAT CCTCGCCGCC GTCATGAGCA CCGCCGACTC CCAGCTGCTG 
GTCGCCGCGT CCGCGCTCAC CGAGGACGGC TACCGGGCCT TCGTGGACCG CGACGCCGAC 
CCCGGGAGGC TGCTGTGGAT CAGCCGCGTC ACCGTGGTCG CCGTCGCCCT CGGCGCCGCG 
GCCATCGCCC TGTGGGGCGA CCAGTCGGTG ATGGACCTGG TCGGCTACGC CTGGGCCGGG 
TTCGGCGCGG GCTTCGGCCC GATCCTGGTG CTCTCCGTGT TCTGGAAGCG CATGAGCTGG 
TCCGGCGCGC TCGCGGGCAT GATCGCGGGC GGCACCACCG CGATCGTGTG GGACGTCCTC 
GACGCCAACT TCTTCGGCAC CGGCCTGTAC GCCATGGTCC CGGCCGTGGT CCTCAGCGTC 
GCCGCCATCC TCGTCTTCAA CGGCCTGGCC AGGGTCACCC CGCAGATGGA GAGCGACTTC 
GACCGGGTCG AGGCGGAGAT CCGCGGGACC GGCTCCGCCC CGGGAGAGGC CGCACGGGTC 
TGA

Protein sequence

MLWSVATFGV YLAAMVAIGL WAYKLTVSQS DFVLGGRQLN SWVAGLSANA SDFSGWLLLG 
LPGAIYVSGL GEAWIAVGLA CGFAGSWILL APRLRVYTER VTDARSGGDS DSLTLSSFLE 
NRFNDPTRLL RGVSAVLIIV FYFFYVASGL VAMAALFDQV FGLSPGPAIA IGVGIVVLYT 
VLGGFLAVSY TDVVQAAMMW IALLAVPVMA VTALGGFAGL TEGVSDKSDG LLSAVGGTAL 
DAELGQWVST DTLGWVVIVS GLAWGFGYFG QPHILSRYMG IRSVRDIPKA AVISVVWAVT 
AMALAVLVGF IGVAYFDTPL ENSEQVFPLL IEALTHPLVA GLLLAAILAA VMSTADSQLL 
VAASALTEDG YRAFVDRDAD PGRLLWISRV TVVAVALGAA AIALWGDQSV MDLVGYAWAG 
FGAGFGPILV LSVFWKRMSW SGALAGMIAG GTTAIVWDVL DANFFGTGLY AMVPAVVLSV 
AAILVFNGLA RVTPQMESDF DRVEAEIRGT GSAPGEAARV