Gene Ndas_1825 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1825
Symbol
ID	9245675
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2231790
End bp	2233391
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	72%
IMG OID
Product	SSS sodium solute transporter superfamily
Protein accession	YP_003679759
Protein GI	297560785
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.915648
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.529366
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGACAA TCGACCTCGT GGTCATCGCG GTGTACCTGC TGGGATCGGC CTGGCTCGGC 
CTCAGGCTCT CCGGCCGACA GCGCGATATC AAGGACTACT TCATCGGCAA CCGGCAGCTG 
CCCTGGTGGG CGGTGTGCCT GTCGGTGGTG GCCACCGAGA CCAGCGCCCT GACCGTGATC 
AGCATCCCCG GCGTGGCCTA CCTGGGCAAC GTCACCTTCC TCCAGGTGGC GGTCGGCTAC 
CTGATCGGGC GGGTGGTCGT GGCCTTCGTG CTGCTGCCCC GCTACTACCG GGGCGAGATG 
ACCACGGCCT ACGCCTACCT CGGCATCCGC TTCGGCCGGG GCATGCAGGG CACGGCCTCG 
GTCGCGTTCC TGTTCACGCG GCTGCTCGCG GACGGGGTGC GGCTGTTCGC GGCGGCCATC 
CCCGTCAAGA TCATCCTGGG CTCCTACGGG GTGGACCTGT CCTACTTCGC GATCATCGCC 
CTGCTGGGCG CGGTCACGGT CCTGTACACC TTCGTCGGCG GCATCCGGGC CGTGGTCTGG 
GTGGACGTCC TCCAGATGGC GGTGTACGCG GTCGGCGGCG TCGCCGCCCT GGCGGTCATC 
GCGGGCAGCC TCGACGCGGA CTTCCTGACG GTGGCCGCCG ACGCGGGCAA GACCCAGTTC 
CTCGACTTCA CCTCGAACCC GGTCTCGGCC CCCTACGCGA CGGTCACCGC GGTCCTGGGC 
GGCGCCCTGC TCTCCACCGC CTCCCACGGC GCCGACCAGA TCATCGTGCA GCGGCTGCTG 
GGCTGCCGCA GCCTGCGCGA CGCCCAGAAG GCGGTGATCG GCAGCGCCGT CGTGGTGTTC 
TTCCAGTTCG CCCTGTTCCT GGCCGTGGGC CTGGCGCTGT ACGCCTACTA CGAGGGCGCC 
TCGGTGGAGG AGCTGGGCCT GGCCAACTCC GACGAGCTCT TCCCGACGTT CATCGTGGAG 
GGGCTGCCGG CCGGCCTGTC GGGCCTGCTG CTGGCGGGGA TCCTGGCCGC GGCGATGAGC 
ACCCTGTCGT CCTCGCTGTC GGCGCTGTCC TCCTCCACCA TGGCCGACCT GTACGAGCGG 
TTCAGCAGGC GCACGCTCAC CGACGCCCAG GGCCTGCGGC TGGGCAGGCT GTTCACCCTG 
GGCTGGGGGC TGGTCTTCAT CGGGGCGGCG GCGATGTTCA CCGGCACCGA CAACCCGGTC 
GTGGAGCTGG GCCTGTCCGT GGCCAGCCTG ACCTACGGCG GCCTGCTGGG CGCGTTCTTC 
CTGGGGCTGT GGGTGCGCCG GGCCCGCCAG CTCGACGCGA TCGTCTCCTT CGCGGTCGCG 
GTGGCCACCA TGGTCTGGCT GTTCCTCTTC CAGCCCGACC TGGTCGGCTT CACCTGGTAC 
ACCGCCATCG GCACGACCAT CGTGCTGGGC CTGGGCTACC TGCTGTCGCT GCGCCACCGC 
GACGCCGCGC CCCGGCCGGA GGAGATGCCG GGGGAGCCCT CCGACACCGG AACCGGGGAG 
CCCTCCGACA CCGGAACCGG GGAGGGCTCC GGCGCCGCGA CCGGCCGGGC GCCCCGCGCG 
GAGGGCGAGC CCACCCCGGC GGACGAGGGG GAGCGGCCCT GA

Protein sequence

MQTIDLVVIA VYLLGSAWLG LRLSGRQRDI KDYFIGNRQL PWWAVCLSVV ATETSALTVI 
SIPGVAYLGN VTFLQVAVGY LIGRVVVAFV LLPRYYRGEM TTAYAYLGIR FGRGMQGTAS 
VAFLFTRLLA DGVRLFAAAI PVKIILGSYG VDLSYFAIIA LLGAVTVLYT FVGGIRAVVW 
VDVLQMAVYA VGGVAALAVI AGSLDADFLT VAADAGKTQF LDFTSNPVSA PYATVTAVLG 
GALLSTASHG ADQIIVQRLL GCRSLRDAQK AVIGSAVVVF FQFALFLAVG LALYAYYEGA 
SVEELGLANS DELFPTFIVE GLPAGLSGLL LAGILAAAMS TLSSSLSALS SSTMADLYER 
FSRRTLTDAQ GLRLGRLFTL GWGLVFIGAA AMFTGTDNPV VELGLSVASL TYGGLLGAFF 
LGLWVRRARQ LDAIVSFAVA VATMVWLFLF QPDLVGFTWY TAIGTTIVLG LGYLLSLRHR 
DAAPRPEEMP GEPSDTGTGE PSDTGTGEGS GAATGRAPRA EGEPTPADEG ERP