Gene Ndas_1744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1744
Symbol
ID	9245594
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2121907
End bp	2123217
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	72%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003679678
Protein GI	297560704
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.795428
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAAGACG AAGGACGAAA GGAAGCCGGG GCGCCGCCCG TGGACGTTCC GCTACGGCGG 
AACCGCAGGT TCCAGCTCCT GTGGGTGGGG TCGGCGTTCT CGTTCTTCGG GCTGGAGGTC 
TCCGAACTCG TCTACCCGCT GGTCGTCCTG GCCCTGACCG GTTCCCCCGC CTGGGCGGGC 
GCCTTCGGCG GCGTGCAGAT GGTCGCCACG CTCCTCGCGG CCCTGCCCGC GGGGGAGCTC 
TGCGACAGGT ACGACCGGCG CGCGCTCCTG CTCCTGGCGG AGGGCACCCG GGCGGCCGCC 
ACGCTGAGCG TGGTGGCGGC ACTCCTGTTC GCGACACTCA CCCTGCCCCA CCTGCTGGTC 
GTCGCGGCAC TCCTCGGCCT GGTCACACCG CTGGGCGGCT CGGCGCGCAT GCTCCTGGTC 
CGCGCCGTGG TGCCCAGGGA ACAGCTCACC TCGGCCCTCA CCCAGGAGGA GGTGCGCAGC 
AACGGCGCGG CCATGGCGGG TCCTCCGCTG GGCGGATTCC TGTACGCGGT GAGCATGGCG 
ACGCCCTTCG TGTTCACCAC GGTCACCTTC GTCCTCTCCG TCGTGTGCGT ACTGTTCGTC 
CGCCCGGTCC CACCCCGGCC CGGGGGCTCC GAGGAGGACG CCGACGGATC GGCCTGGACC 
CGGATGCTGT CGGGCCTCAG GACGATGGCC GCCGCCACCG AGCTGCGCCG GGTCCTGCTC 
TTCACCGTCC TGATGAACGC GGTGAGCGCG CCCTTCCTCC TGATCTCGGT GGTGGTCCTG 
GAGGAACAGG GCGCGTCCTC CACGGTGATC GGTTTCGCCA TGATGGGCCT GGCGGCGGGC 
GGCCTGGTCG GCGCCTTCCT GGTCAAGCCC CTGCACCGGC TGCTGCCCCC CGGCGGGGTC 
ATGCTCGCGG TGGGCGGCAG CACCGTCCTC CTCATCGCGC TCTTCGCCGT CCCGTGGGGC 
CCCTGGTGGC TGGCCGCCCT CCTGTTCCTG CTCACCGTCG GCGTCCCGGC GATGCGGATC 
CTGGTCGACC TGCTGATCTT CCGTCAGGTG TCCGACGAGA TCAGGGGAAG GGTGATCGCG 
GCGGCGATGA CCCTCTACGG GGTGGGAGGC GCCGTCGGCA TGGCCGGGGC CGGTCTGCTC 
CTGGAGTTCC TGCGGCCCGG CCACGCGGTC CTCACCCTGG CCGCCGTGCT CGCCGTGTGC 
GTGCTCCTCG CCTTCGCCCA CCGGGGCTTC CGGACCATGG CGTGGCCCGT GGAGTCCGCT 
GACGGCGACG GTTCCCCGGA GAGGTCCACC AGCGAGGCCG ACCCCAACTG A

Protein sequence

MEDEGRKEAG APPVDVPLRR NRRFQLLWVG SAFSFFGLEV SELVYPLVVL ALTGSPAWAG 
AFGGVQMVAT LLAALPAGEL CDRYDRRALL LLAEGTRAAA TLSVVAALLF ATLTLPHLLV 
VAALLGLVTP LGGSARMLLV RAVVPREQLT SALTQEEVRS NGAAMAGPPL GGFLYAVSMA 
TPFVFTTVTF VLSVVCVLFV RPVPPRPGGS EEDADGSAWT RMLSGLRTMA AATELRRVLL 
FTVLMNAVSA PFLLISVVVL EEQGASSTVI GFAMMGLAAG GLVGAFLVKP LHRLLPPGGV 
MLAVGGSTVL LIALFAVPWG PWWLAALLFL LTVGVPAMRI LVDLLIFRQV SDEIRGRVIA 
AAMTLYGVGG AVGMAGAGLL LEFLRPGHAV LTLAAVLAVC VLLAFAHRGF RTMAWPVESA 
DGDGSPERST SEADPN