Gene Ndas_2277 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2277
Symbol
ID	9246127
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2724489
End bp	2725898
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	69%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003680205
Protein GI	297561231
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.419016
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.219783
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACCA CACCACCGGA GACGGACGCC ACCGGCGCCC CCTCCGCCGA TCCCGGCCAG 
CGCAGGCGCG AACAGCGCGG CTGGTACCTC TATGACTGGG CCAACTCGGT GTTCACCACC 
TCGGTGGTGA CCGTGCTCAT CGGCCCGTAC CTGAGCAACC TGGCGTGTGT GTCGGCCGGG 
GCCCCTGACG CCGCGTCCTG CCTGGACCCC GCGCTGTCCA TCAGCCCGCT GGGCCTGGAC 
TTCCTCTCGC TGCACCCCAA CGCGCTCTAC CCGGCGCTGA CCACGGTGGC GATCCTGCTC 
CAGATCCTGT GCCTGCCGAT CGTGGGGTCG ATGGTCGACC ACTCGCGGCA CAAGAAGCGG 
TGGCTGCTCT GGCTCGCCGT AGGCGGGTCG GCGTGCACGC TGGGGCTGTA CTTCGCCACC 
GACGGCTACC TGGTGGCCTC GGTACTGTTC GTGCTGGCCA ACCTGCTGTA CGGGCTGGCG 
GGCGTGGTCT ACAACGCGTT CCTGCCCGAG GTGGCCACGG CCGAGGAACG CGACCGGGTC 
TCGGTCACCG GCTGGGGCAT CGGCTACCTC GGCGGGGCCC TGCTGCTCGC CATCCACCTG 
GGCCTGGTGG TCGGCGCTCC GTCCCTGGGC CTGGGCACGG ACGACGCCGC GCGCATCGCC 
TTCGCCTCCT GCGGCCTGTG GTGGGCGGGG TTCACCGTCC TGGCGGTGCG GCCGCTGCGC 
AACCGCTACG GCGCCCTGGC GGCGAGCAGC CGGGGGCGGC CGAAGGTGGG ACGGTCGCTG 
CGCCAGTTCG GGCACACGCT CAAGGACATG CGCAAATACC CGAACACGAT TCTCTTTCTC 
CTGGCGTTCA TCCTGTTCAA CGACGGTGTG CAGGCGGCCA TCCGCTACGC GGCGCCCTTC 
GCCACCCAGG ATCTGGGACT GGACCAGAAC GTCCTGATCG TCACCATCCT CATCATCCAG 
TTCGTGGCCT TCGGGGGCGC CTTCCTGACC GGCCGGGTGG CCCGGGTCCT GGGCAGCAAG 
AACACCGTGC TGGCCACGCT CGCGGTGTGG AGCTCGCTCG TGGCGGCGGC CTACTTCCTC 
CCGGTCGGGA ACGTGCCGCT GTTCGTGGCC ATGGGCGTGG GCATCGGCCT GGTGCTGGGC 
GGCACCCAGT CGCTGGCCCG GTCGCTGTAC TCCCAGCTCA TCCCCCGTGG GCGCGAGGCG 
GAGTACTTCA GTCTGTACCA GATCTCGGAC AAGGGATCGA GCTTCCTGGG ATCGCTGACC 
GTGACCGTGG CCGTCTCCCT CACCGGCGGC TACCGGATGG CGATCCTGTC GCTGATCGTG 
TTCTTCGTCA TCGGCGGTCT GCTGCTGTGG CGCACACGCA TGCGCGAGGG GATTCTCGCG 
GTGGGCAACG AGGTACCGCG CAACCTGTAG

Protein sequence

MATTPPETDA TGAPSADPGQ RRREQRGWYL YDWANSVFTT SVVTVLIGPY LSNLACVSAG 
APDAASCLDP ALSISPLGLD FLSLHPNALY PALTTVAILL QILCLPIVGS MVDHSRHKKR 
WLLWLAVGGS ACTLGLYFAT DGYLVASVLF VLANLLYGLA GVVYNAFLPE VATAEERDRV 
SVTGWGIGYL GGALLLAIHL GLVVGAPSLG LGTDDAARIA FASCGLWWAG FTVLAVRPLR 
NRYGALAASS RGRPKVGRSL RQFGHTLKDM RKYPNTILFL LAFILFNDGV QAAIRYAAPF 
ATQDLGLDQN VLIVTILIIQ FVAFGGAFLT GRVARVLGSK NTVLATLAVW SSLVAAAYFL 
PVGNVPLFVA MGVGIGLVLG GTQSLARSLY SQLIPRGREA EYFSLYQISD KGSSFLGSLT 
VTVAVSLTGG YRMAILSLIV FFVIGGLLLW RTRMREGILA VGNEVPRNL