Gene Ndas_3487 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3487
Symbol
ID	9247356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4179849
End bp	4181339
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	71%
IMG OID
Product	sulphate transporter
Protein accession	YP_003681394
Protein GI	297562420
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTGC CCGTGAAGAC CCCCAGGTCC CTCAAGGCCC GGATCCCCGC CGCCGCGCAG 
CTGCGCGCCG ACGTGCTGGC CGGACTGGTC GTCGCCCTGG CCCTGATCCC CGAGGCCATC 
GCCTTCTCCC TCATCGCCGG GGTCGACCCC CGCGTGGGCC TGTACGCCTC CTTCGTGATG 
GCCGTGTCCA TCGCCTTCCT GGGCGGGCGG CCCGCGATGA TCTCCGCCGC CACCGGAGCG 
ATGGCCCTGG TCGCGGCGCC GCTGTCGATG GAGCACGGCG TCGACCACCT GATCGCCGCC 
ACCATCCTGG CCGGGCTCAT CCAGGTCGCC CTGGGCCTGC TCGGGGTGGC CAGGCTGATG 
CGGTTCGTGC CGCCCAGCGT CATGACCGGG TTCATCAACG CCCTGGCCAT CCTCATCTTC 
ACGGCCCAGC TGCCCTACCT GGAGGGCGTG GGCGTGCCGA TCTACGCCAT GGTGGCCGTG 
GGCCTGGTCA TCGTCTTCGG CCTGCCCCGC CTGACCAGGG CGGTCCCCGC GCCGCTGGTG 
GCCATCGTCG TGCTCACCGC GGCCGCGCTG GCCCTGGGCA TCCCGGCGCA GACGGTCGGG 
GACATGGGCG AACTGCCCGA CACCCTGCCC GTGCCGCTGA TCCCGGACGT GCCCTACACG 
CTGGACACGC TGGTCCTGAT CGCCCCCTAC TCGCTGACCC TGGCCCTGGT GGGGCTGATG 
GAGTCGCTGA TGACCGCCAA GGTCGTCGAC GACCAGACCG AGACCGCCTC GAACCACGGC 
CGCGAGGCCC GCGGACAGGG CATCGCCAAC GTGCTGGTCG GGTTCTTCGG CGGCATGGCC 
GGGTGCGCGA TGATCGGCCA GACCATGATC AACGTCAAGT CCGGGGCCCG CACCCGCGTC 
TCGACCTTCC TGGCCGGCGT GTTCCTGATC ATCCTGTGCG TGGCCCTGGG CGACCTGGTG 
GGCATGATCC CGGTCGCGGC GCTGGTCGCG GTGATGTTCT TCGTGGCCAT CGTGACCTTC 
GACTGGCACA GCGTCGCCCC GGCCACCCTG AGGCGGATGC CCTGGACCGA GACCCTGGTC 
ATGGTCATCA CCGTCGCCGT GGTCGTGGCC ACCCACAACC TGGCCCTGGG CGTGATCGTC 
GGGGTCGTGG TGTCCATGGT GCTCTTCGCC CGCCGGGCCG CCATGCAGGC CGACGTCACC 
AGCGTGCTCG ACCCCGAGGG CGGCACCCGC GTGTACTCGG TCAACGGCGA GGTGTTCTTC 
GCCTCCACCG GCGAGCTGGT CAACCGGTTC GACTACACCG AACAGGGTCT GGAGAAGGCG 
GTGGTGGACA TGTCCAACGC GCACGTGTGG GACTCCTCGG CCGTGGCCGC CCTGGACCAG 
GTCACCGAGC ACTTCCGCAG GCACGGGGTG CGGGTGGAGA TCACCGGCCT CAACGGGCCC 
AGCGCGCACC TGCACCGGGA GCTGTCCGGG ACCCTCACCG GCGGCCACTG A

Protein sequence

MKLPVKTPRS LKARIPAAAQ LRADVLAGLV VALALIPEAI AFSLIAGVDP RVGLYASFVM 
AVSIAFLGGR PAMISAATGA MALVAAPLSM EHGVDHLIAA TILAGLIQVA LGLLGVARLM 
RFVPPSVMTG FINALAILIF TAQLPYLEGV GVPIYAMVAV GLVIVFGLPR LTRAVPAPLV 
AIVVLTAAAL ALGIPAQTVG DMGELPDTLP VPLIPDVPYT LDTLVLIAPY SLTLALVGLM 
ESLMTAKVVD DQTETASNHG REARGQGIAN VLVGFFGGMA GCAMIGQTMI NVKSGARTRV 
STFLAGVFLI ILCVALGDLV GMIPVAALVA VMFFVAIVTF DWHSVAPATL RRMPWTETLV 
MVITVAVVVA THNLALGVIV GVVVSMVLFA RRAAMQADVT SVLDPEGGTR VYSVNGEVFF 
ASTGELVNRF DYTEQGLEKA VVDMSNAHVW DSSAVAALDQ VTEHFRRHGV RVEITGLNGP 
SAHLHRELSG TLTGGH