Gene Ndas_0990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0990
Symbol
ID	9244836
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1210996
End bp	1212678
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	68%
IMG OID
Product	SSS sodium solute transporter superfamily
Protein accession	YP_003678940
Protein GI	297559966
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.394544
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGTGC TAGCACAGGA CTCCCTGCGG CTGGACGCCA ACGCCATCGA CTACACCCTG 
CTCGCGGTGT ACTTCGCGTT CGTGCTGGGC ATCGGCTTCA TCGCCCGGCG TTCGGTCTCC 
AACAGCCTCG ACTTCTTCCT GTCGGGGCGC TCCCTGCCCG CCTGGGTGAC GGGTCTGGCC 
TTCATCGCGG CCAACCTCGG CGCCATCGAG ATCATCGGCA TGTCGGCCAA CGGCGCCAAC 
TACGGCATGC CGACCATGCA CTACTTCTGG ATCGGCGCCG TCCCGGCGAT GCTGTTCCTG 
GGCCTGGTCA TGATGCCGTT CTACTACGGC TCCAAGGTCC GCAGCGTCCC CGAGTTCATG 
CTCCGCCGCT TCGGCACCGC CGCCCACCTG CTCAACGGGA TCAGCTTCGC GGTCGCCCAG 
ATCCTGATCG CGGGCGTCAA CCTCTTCCTG CTGGCGACCA TCGTGGACGC GCTGCTGGGC 
TGGCCCCTGT GGCTGTCGCT CCTGGTCGCC GCCGCGATCG TCCTCAGCTA CACCGCGCTG 
GGCGGGCTCT CCGCGGCGAT CTACAACGAG GTGCTCCAGT TCTTCGTCAT CGTCGCGGCG 
CTGCTGCCGC TGACCCTGGC GGGGCTGAAC CGGGTCGGCG GCTGGTCGGG TCTGGTGGAG 
GAGGTCACCG CCTCCCCGCA GGGCGCCGAA CAGCTCTCCG CCTGGCCGGG CAACGCGCTG 
ACCGGTTTCG GCGACAGCTT CCTGAGCATC CTCGGCATCG TCTTCGGCCT CGGCTTCGTC 
CTCGCGTTCG GCTACTGGAC GACGAACTTC GTCGAGGTGC AGCGCGCCAT GGCCTCCAAG 
AGCATGTCGG CCGCGATGCG CACCCCCATC ATCGGCGCCT TCCCCAAGCT GTTCATCCCG 
TTCATCGTCA TCATCCCCGG GATGATCGCG GGCGTGAGCG TCTCGGAGAT GGTCCAGCTC 
AAGGCCGGTG AGAACCCCGG CGTCGACTAC AACGACGCGA TCCTGCTGCT GATGCGCGAC 
GTGCTGCCCA ACGGTCTGCT GGGCGTGGCC CTGGCCGGTC TGCTCGCGTC GTTCATGGCC 
GGTATGGCCG CCAACCTCAG CTCGTTCAAC ACCGTGTTCA CGTACGACAT CTGGCAGGCC 
TACGTCGTCA AGAACCGGCC CGACTCCTAC TACCTGGGCA TGGGCCGGTG GGTCACGGTC 
GGCGCCACCG TCGGCGCCGT GGGCACGGCG TTCATCGCCT CGGGCTACTC CAACCTGATG 
GACTACCTGC AGCAGCTGTT CTCGTTCTTC AACGCGCCGC TGTTCGCCAC GTTCATCCTC 
GGTATGTACT GGAAGCGGAT GACGCCCCAC GCCGGTTGGA GCGGCCTGGC GGCGGGAACC 
CTGGCCGCCG TGGGCGTGTT CCTGCTCGCC GAGACCGGAG TACTGGCCCT GTCGGCGCAG 
GGCGCGAGCT TCGTCGGCGC GGGAGCGGCC TTCGTGGTCG ACATCCTCGT CAGCGTCGTG 
GTCACCATGT TCACCCGGCC CAAGCCCGAC TCCGAGCTGG TGGGCCTGGT GCACTCGCTG 
ACCCCGCGCG AGTCGCGCAA GGCCTCCACC ACCGGTGAGG ACGCCGGCTG GTACCGCCGA 
CCGGGGCTGC TGGCCGGGAT CGCCCTGGTG CTCGTCATCG TCCTGAACAT CATCTTCGCC 
TGA

Protein sequence

MTVLAQDSLR LDANAIDYTL LAVYFAFVLG IGFIARRSVS NSLDFFLSGR SLPAWVTGLA 
FIAANLGAIE IIGMSANGAN YGMPTMHYFW IGAVPAMLFL GLVMMPFYYG SKVRSVPEFM 
LRRFGTAAHL LNGISFAVAQ ILIAGVNLFL LATIVDALLG WPLWLSLLVA AAIVLSYTAL 
GGLSAAIYNE VLQFFVIVAA LLPLTLAGLN RVGGWSGLVE EVTASPQGAE QLSAWPGNAL 
TGFGDSFLSI LGIVFGLGFV LAFGYWTTNF VEVQRAMASK SMSAAMRTPI IGAFPKLFIP 
FIVIIPGMIA GVSVSEMVQL KAGENPGVDY NDAILLLMRD VLPNGLLGVA LAGLLASFMA 
GMAANLSSFN TVFTYDIWQA YVVKNRPDSY YLGMGRWVTV GATVGAVGTA FIASGYSNLM 
DYLQQLFSFF NAPLFATFIL GMYWKRMTPH AGWSGLAAGT LAAVGVFLLA ETGVLALSAQ 
GASFVGAGAA FVVDILVSVV VTMFTRPKPD SELVGLVHSL TPRESRKAST TGEDAGWYRR 
PGLLAGIALV LVIVLNIIFA