Gene Ndas_1835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1835
Symbol
ID	9245685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2242208
End bp	2243713
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	76%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003679769
Protein GI	297560795
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0636096
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.396011
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCCGAA CCCGGACGGG GGAGACGACC GCGCGCCTGC TGCTCGCCCT GGTGTGCGCC 
GCGCAGCTCA TGGTGGTGCT CGACGTGTCG GTGGTCAACG TCGCCCTGCC CTCGATCCGC 
TCCTCCCTGG GGTTCTCCGC GACGGGGCTG CCCTGGGTCG CCCACGCCTA CACCCTGGCC 
TTCGGCGGCC TCCTGCTGCT GGGCGGGCGG CTGGCCGACC TGTACGGACA CCGGCGGGTG 
TTCGCCGCCG GGCTCGCGCT GTTCTGCGCG GCCAGCCTGC TGGGCGGGGC GGCCCCCTCC 
CCCGTCCTGC TGGTCACCGC CCGCGCGCTC CAGGGAGCGG GCGCGGCGGT ACTGGCCCCC 
GCGACCCTGA CCATCCTGAC CGCCTCCTTC CCCGAGGGGC GGGCCCGCGT GCGTGCGCTG 
GCCGCCTGGA CCGCGGTGAG CGTGGCGGGC GGCGCGGTCG GCAACCTCCT CGGCGGCGCG 
CTGACCGAGG CGCTGTCCTG GCGGTCGGTC CTGCTGGTCA ACGTGCCCGT CGGCATCGCG 
GCGCTGGCCA TGACCCCCTA CCTCCTGGGC CGGGAACGCC ACGACCGCGA CCCGGCCAAC 
ACGGGTCAGC GTGACCGGGA GCGCCACGAC CGCGCCCCTC ACAGCACGGG TTCTCCTGGC 
CGGGACCCGC GTGGCCGGAG CCCGGGAGAG GGCCGCGGCG GACGGATCGA CCTGCCCGGG 
GCGGTGACCG CGACTGGCGG GACGGTCGCG CTCACCTACG GCCTCACCCG CACGGCGGAG 
CACGGCTGGG GGGACCCGGC CGCGGTGGCG GTGCTGGCCG CGGGCGTCCT CGCCCTGGCG 
CTGTTCGCCG CGGTGGAGTC CCGTGCGCCC GCTCCCCTCC TGCCGCCGGG GCTCCTGCGC 
CGCCGCGCGG TCTGGGCGGG CAACGCCATG GTGTTCCTGG CCGGAGTCTG CTTCCAGGTG 
CCCATGTGGT ACTTCCTCAC CTTCTACATG CAGGACGAGC TGGGCTTCGG GCCGCTGCTG 
ACCGGCCTGG GCTTCCTGCC GCACACCCTG GTCACCATGG CCGTGGGCTG GCTGGTCACC 
CCGTGGCTGA TGGGGTTCGT GCGGGCGCGA ACGCTGATCG GGGTCGGCTG CCTCACCGCC 
GCGGCGGGCT TCGCCTGGCA GGCCGCGGCG GTGACCGAGC AGACCTACGC CGCGGCGGTG 
CTGGGGCCCG CGGTCCTCAT GTCCGTGGGC GGCGGCCTGT TCACCACTCC GCTGACCGCC 
GTCGTGACCT CGGGCGCCGC CCCCGGGGAC GCGGGGGCCG TCTCGGGCCT GATGAACGCG 
GCCAAGCAGA CGGGCGGCGC CCTGGGCCTG GCCGCGCTGA TGACGACGGC CGTCTCGGGG 
CACGCACCCG AAGGGGAGGC GTACGGCTTG GTCTTCGGCC TGCTCGCGGC CGTGCAGCTC 
GTGGCGGCCG CCCTGACACC GGTACTGCCG CGCGAAACGC GACGGGATCC GTCCGAGGGC 
GCGTGA

Protein sequence

MPRTRTGETT ARLLLALVCA AQLMVVLDVS VVNVALPSIR SSLGFSATGL PWVAHAYTLA 
FGGLLLLGGR LADLYGHRRV FAAGLALFCA ASLLGGAAPS PVLLVTARAL QGAGAAVLAP 
ATLTILTASF PEGRARVRAL AAWTAVSVAG GAVGNLLGGA LTEALSWRSV LLVNVPVGIA 
ALAMTPYLLG RERHDRDPAN TGQRDRERHD RAPHSTGSPG RDPRGRSPGE GRGGRIDLPG 
AVTATGGTVA LTYGLTRTAE HGWGDPAAVA VLAAGVLALA LFAAVESRAP APLLPPGLLR 
RRAVWAGNAM VFLAGVCFQV PMWYFLTFYM QDELGFGPLL TGLGFLPHTL VTMAVGWLVT 
PWLMGFVRAR TLIGVGCLTA AAGFAWQAAA VTEQTYAAAV LGPAVLMSVG GGLFTTPLTA 
VVTSGAAPGD AGAVSGLMNA AKQTGGALGL AALMTTAVSG HAPEGEAYGL VFGLLAAVQL 
VAAALTPVLP RETRRDPSEG A