Gene Ndas_1178 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1178
Symbol
ID	9245028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1434019
End bp	1435248
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	72%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003679125
Protein GI	297560151
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0192681
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.359878
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAAGT CCGTCTACCT CATGGCGCTC GGCATCTTCG CCATGGTCAC CAGCGAGCTG 
CTCGTCGGTG GACTCATGCC GCAGATGTCC GAGGACCTGG GGGCCACCAT CCCGCAGATC 
GGCTACCTCA TCACCGCGTT CGCACTGGCG ATGGCGCTCG GCGGGCCGCT GGCGACCCTG 
TCGGTGCTCC GGCTGCGCAC GAACCACGCC CTGATGGTGC TCTTCGCCAT CTTCTTCGTC 
GGCAACGCGC TGGCCGCCCT CTCCACCTCC TACTGGCCCA TGCTCGTGGC CCGCGTGATC 
ACCGGAGCGG CAGCCGGAGC CTTCTTCGGC GTCGCCCTGT CGGCGGTCGC GCAGGTCACC 
GCGCCGCACC TGCGCGGGCG CGCCACCGGT GTGGCCCTCC AGGGCCTCAT GGTGGGCACC 
CTGCTCGGCC TGCCGCTGTC CACGCTCATC GGCGGCCAGT TCGGCTGGCG CGCCGCCTTC 
GCCGCCGTCG GCGTGCTGAC CGTGGTCGTG GCCGTGGCCA CCATGCTCGC GCTGCCGCGC 
CTGGAGAAGG CCGAGGAGGC CGGGGCCCTG CGCTCCGAGC TGGAGGTGTT CCGCCGCCCG 
CGCCTGTGGA CGATCATGGC CACCTCCACG CTCATCATCG GCGCCACCTT CGCGGCGTTC 
TCCTACTTCA CGCCGATCCT CACCGAGGTC ACCGGGTTCT CCCGCGACAT CGTGCCGCTG 
CTGCTCCTGG GCTACGGCGG GGCGACGGTC ATCGGCAACA TCGTGGTCGG CCGCCTGGCC 
ATGTCCCACA CCGTGACCGT CATCGTGGCC GGTCTGGCGC TCAACACGGT CTTCCTGGGC 
GTCTTCGCCC TCTTCGCGGA CCTGCCGGTC CCCGCCCTGC TGGCGATGGC GGGCATCGGC 
CTGGTGGGCA TCACGCTGAA CCCCGCGATG ATCACCCGCG TCCAGCGCGC CGGGAACCCG 
CGCGCCCTGG TCAACACCGT GCACTCCTCG TTCATCACCA TGGGCGTGGT CGTCGGCTCC 
TGGGTCGGCG GCATGGGCAT CGACGCCTTC GGCCTGCGCG CACCGCTGTG GGTCGGCGTC 
GGCCTGGCCC TGCTCGCGCT GCTGGCCATG GTGCCCGCGG CCCTGACCGC GCGCAGGGTG 
GGCCACGAGG CCACCGACCT GTACGTGCCG CCCCCGGCCG CGCCGCGGCC GGTCGAGGAG 
GACCGGGCCG CCCACCCCAC GGGAGCCTGA

Protein sequence

MPKSVYLMAL GIFAMVTSEL LVGGLMPQMS EDLGATIPQI GYLITAFALA MALGGPLATL 
SVLRLRTNHA LMVLFAIFFV GNALAALSTS YWPMLVARVI TGAAAGAFFG VALSAVAQVT 
APHLRGRATG VALQGLMVGT LLGLPLSTLI GGQFGWRAAF AAVGVLTVVV AVATMLALPR 
LEKAEEAGAL RSELEVFRRP RLWTIMATST LIIGATFAAF SYFTPILTEV TGFSRDIVPL 
LLLGYGGATV IGNIVVGRLA MSHTVTVIVA GLALNTVFLG VFALFADLPV PALLAMAGIG 
LVGITLNPAM ITRVQRAGNP RALVNTVHSS FITMGVVVGS WVGGMGIDAF GLRAPLWVGV 
GLALLALLAM VPAALTARRV GHEATDLYVP PPAAPRPVEE DRAAHPTGA