Gene Ndas_0983 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0983
Symbol
ID	9244828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1203098
End bp	1204543
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	72%
IMG OID
Product	General substrate transporter
Protein accession	YP_003678933
Protein GI	297559959
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.359093
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACGAGC CGCAGCCGCA GGGGCGGACG GCCCTGACCA CGGACCGCAG GGCGACGCGC 
AAGGCCGTGG TGGCCGCGGC GATCGGCAAC GCGACCGAGT GGTACGACTT CGGCGTCTAC 
AGCTACCTGG CCGTCACGAT CGGCCTGGTG TTCTACCCGG CGCAGACCCA GGGCACCCAG 
CTCATCGCCA CCTTCACCAC CTTCGCCGCC GCCTTCCTGG TGCGGCCCCT GGGCGGGCTG 
TTCTTCGGCC CCCTCGGCGA CAGGATCGGC CGCAAGCGCG TCCTGGCCTT CACGATGCTG 
CTCATGGCGG TGAGCACGTT CTCGATCGGG CTCATCCCCT CGGCCGCGAG CATCGGCTTC 
GCCGCGCCCG TGCTGCTGCT GGTCGCGCGG ATGCTCCAGG GCTTCTCCAC CGGCGGCGAG 
TACGGCGGCG CCACGACCTT CATCGCCGAG TACGCGCCCG ACCGGCGGCG CGGCTTCCTG 
GCCTCCTGGC TGGAGTTCGG CACGGTCAGC GGCTACGTCG GCGGCGCCAC CGTCGTCACG 
GTGATGACCC TCCTGCTCGG TTCGGACACC ATGCAGGACT GGGGGTGGCG CGTCCCCTTC 
CTGGTCGCGC TGCCGCTGGG CGCCGTCGGC CTGTACCTGC GGGTGAAGCT GGAGGACACC 
CCCGTCTTCG AGCAGAACAC CGGGGGCTAC GCCAAGGACT CCCACGGCGG GCACCGCGAG 
GGACAGCTGC GGGCGACGGT CGTGGACCAG TGGCGCCACA TCCTGCTGTG CGTGGGCCTG 
GTGATGGTCT TCAACGTCAA CAACTACGTC CTGACCGCGT ACATGCCCAC CTACCTGGAG 
GCGGAGCTGG GGTACGGCCC CACCACGGCT CTGGTGCTGA CGCTGGCGGC GATGGTGCTG 
ATGCTGTTCG CGGTGACCGG GTTCGGACAC CTGAGCGACC GCGTGGGGCG CAGGCCCGTG 
CTGCTCTCGG GCAGCCTGTT CTCGATCGTG CTGGCCCTGC CCGCCTTCTG GCTGCTGCAA 
CAAGGGGGCC CGTGGACGGT GGCCCTGGGC ATGGTGGTGC TGGCGGTGAC CCTGGTGCAC 
TTCTCCGGCG GCGCGCCCGC GGCGCTGCCG GCGTTCTTCC CCACCAGCGT GCGCTACGGC 
GCGCTGGCCA TCAGCTTCAA CGTGTCGGTG GCGCTGTTCG GCGGCACCAC CCCGCTGGTC 
GCCGAGGCGC TGGTGCAGGC CACCGGAAAC CTCTACGCAC CGGCGTGGCT GGTGATGGTC 
GCGGGAGTGG TGGGGCTGGT GGTGGTGTGG CGGATGAAGG AGAGCGCGAA CCGCCCGCTG 
CCCGGCGCCC CCGCGATCCC CGTCCCCGGG GAGGAGGGGG GCCGACCGCC CCGCTCCCGC 
AAGGGGGGAA CGACGGGGAG CCACCCGCCG CAGGGCAACG TCCGCCGCCT GAGCGGGGAG 
GCCTGA

Protein sequence

MNEPQPQGRT ALTTDRRATR KAVVAAAIGN ATEWYDFGVY SYLAVTIGLV FYPAQTQGTQ 
LIATFTTFAA AFLVRPLGGL FFGPLGDRIG RKRVLAFTML LMAVSTFSIG LIPSAASIGF 
AAPVLLLVAR MLQGFSTGGE YGGATTFIAE YAPDRRRGFL ASWLEFGTVS GYVGGATVVT 
VMTLLLGSDT MQDWGWRVPF LVALPLGAVG LYLRVKLEDT PVFEQNTGGY AKDSHGGHRE 
GQLRATVVDQ WRHILLCVGL VMVFNVNNYV LTAYMPTYLE AELGYGPTTA LVLTLAAMVL 
MLFAVTGFGH LSDRVGRRPV LLSGSLFSIV LALPAFWLLQ QGGPWTVALG MVVLAVTLVH 
FSGGAPAALP AFFPTSVRYG ALAISFNVSV ALFGGTTPLV AEALVQATGN LYAPAWLVMV 
AGVVGLVVVW RMKESANRPL PGAPAIPVPG EEGGRPPRSR KGGTTGSHPP QGNVRRLSGE 
A