Gene Ndas_2994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2994
Symbol
ID	9246847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3577285
End bp	3579183
Gene Length	1899 bp
Protein Length	632 aa
Translation table	11
GC content	74%
IMG OID
Product	Na+/solute symporter
Protein accession	YP_003680910
Protein GI	297561936
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.77047
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.396474
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCG CCGCAGCGGC CGCGGGCGGT GCCGTCACGG GGGACGGCAC CGCCGCGGTG 
GCCGTCGGAG TGGCGGCCGT CACCGAAACG CCCGCCGCTG CCGCACCGCC CGCGTCCACC 
GTCCCGGTCG CGCCCGCCGA ACCGCCCGCT GCCGAAGCAC CGTCCGCGTC CACCGTTCCG 
TCCGCGGCCG CCGACCCCCT GGACGCCCTG GGCGGCGCGC TGGGGAGCGA GTTCGGCGTC 
GCGCACGCCT GGACGGTGGG CCTGTGCGCC CTGTTCGTCC TGGTCACCCT CGCCGTCACC 
GTCCGCGCCA GGCGCACCAC CCGGGGCGCG GTCGACTTCT ACGCGGGCGG ACGCGGCTTC 
TCCAGCACCC AGAACGGGCT CGCCCTGACC GGCGACTACC TGTCCGCGGC CTCCTTCCTG 
GGCATCGCCG GGATGATCTC CCTCCAGGGC TACGACGGCT TCCTGTACTC CATCGGCTTC 
CTGGCGGCCT GGCTGCTGGT GCTGCCGATG GCCCAGCTGG TGCGCAACAC CGGCCGCTTC 
ACCATGGCCG ACCTGCCCGC CTTCCGCATG AACCGGATGC GGGTGCGCCT GGCCTGCACC 
GTCTCCACCG TCACCGTGTG CGTGTTCTAC CTGGTCGCGC AGATGGTCGG CGCCGGAGCC 
CTGGTCGCGG TCCTGCTGGG CCTGCACGAC GGCGGGACCT TCCTGGGGAT GGGCGCCGAG 
CAGGCCCGCA CGGGCGTGAT CGTGCTCGTG GGCGTGCTCA TGATCGTCTA CGTCATGTAC 
GGCGGCATGA AGGCGGCCAC CTGGCTCCAG ATCATCAAGG CGGTCGCGCT GCTGGCCGCC 
ACCGGACTGC TCACCGCCCT GGTGCTGGCC CTGTTCGCCT TCGACCCGCG CGCCCTGCTC 
GGCGGGGCCG CCGAGGCCAG CGGGCACGGT CAGGCCTTCC TGGAACCGGG GCTGCGCTTC 
GGGGTGGAGG TCTCCGGCGA CCCCGCCCGG ACCCTGTTCA ACAAGCTCGA CCTCCTCAGC 
CTCGGGCTGG CCCTGGTGCT GGGCACCGTC GCGCTGCCGC ACATCCTCAT CCGCTTCTAC 
ACCGTGCCCG ACGGCCGGGC GGCGCGCTCG TCGGTCAACC GCACGATCGT CATGGTCGGG 
GCCTTCTACC TCATGACGCC GGCCCTGGGC TTCGGCGCCG CGGCGCTGGT CGGCTCCGAG 
CGCATCGCGG CCGCGGACCC CTCGGGCAAC ACCGCGGTGC CGATGCTCGC CGAGGAGGTG 
GGGCGGCTGA CCGCCGGTCC CGCGGGCGCG GCCGTGCTGC TCGCGCTGGT CTCGGCGGTC 
GCGCTGGCCA CCGTCCTCGC CGTCATCGCC AGCCTCACCC TGGCCTCGTC CTCCTCGATC 
GCGCACGACC TGTTCGGCCA CATCCTCATG TGGGGCAGGC CCCGGGAGTC GCAGGAGGTG 
GGTGTGGCGC GGCTCTCCGC CTGCGTGATC GGCGCCGTGG CCGTCGTGCT GGCCGTGCGG 
GCCCAGGACA TGAACGCGGC CTTCCTCGTG GGGCTGGCCT TCGCCGTCGC GGCCGCGGCC 
AACCTGCCGG TCATCGTGCT CACCATGTTC TGGCGCCGCT TCAACACCAG GGGTGTGGAG 
TGGGGCGTCT ACGGCGGCCT GTCCGCCACC CTGCTGCTCA TGCTGCTGTC GCCGGTGATG 
TCGGGCAGGA CCGACCCCGT CACGGGGGAG AACCTGTCGG TGCTGCCCGC CTGGATCGAC 
GTCCAGCTCT TCCCGATGGA GAACCCGGCG CTGCTGGCGG TGCCGTTCGG CTTCGCGTGC 
GCGGTCGTGG GCAGCCTGCT CTCGCCGGAG CGCGACACCG CGCGCTTCAC CGAGCTGCGG 
GTGCGCTCCC TGACCGGGTG GGGCGTCGAG CGGGACTGA

Protein sequence

MSAAAAAAGG AVTGDGTAAV AVGVAAVTET PAAAAPPAST VPVAPAEPPA AEAPSASTVP 
SAAADPLDAL GGALGSEFGV AHAWTVGLCA LFVLVTLAVT VRARRTTRGA VDFYAGGRGF 
SSTQNGLALT GDYLSAASFL GIAGMISLQG YDGFLYSIGF LAAWLLVLPM AQLVRNTGRF 
TMADLPAFRM NRMRVRLACT VSTVTVCVFY LVAQMVGAGA LVAVLLGLHD GGTFLGMGAE 
QARTGVIVLV GVLMIVYVMY GGMKAATWLQ IIKAVALLAA TGLLTALVLA LFAFDPRALL 
GGAAEASGHG QAFLEPGLRF GVEVSGDPAR TLFNKLDLLS LGLALVLGTV ALPHILIRFY 
TVPDGRAARS SVNRTIVMVG AFYLMTPALG FGAAALVGSE RIAAADPSGN TAVPMLAEEV 
GRLTAGPAGA AVLLALVSAV ALATVLAVIA SLTLASSSSI AHDLFGHILM WGRPRESQEV 
GVARLSACVI GAVAVVLAVR AQDMNAAFLV GLAFAVAAAA NLPVIVLTMF WRRFNTRGVE 
WGVYGGLSAT LLLMLLSPVM SGRTDPVTGE NLSVLPAWID VQLFPMENPA LLAVPFGFAC 
AVVGSLLSPE RDTARFTELR VRSLTGWGVE RD