Gene Ndas_4568 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4568
Symbol
ID	9248449
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5412897
End bp	5414282
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	76%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003682461
Protein GI	297563487
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCCACAC GCGACCGCGG CGGGATACTC CTCCTCGCCG TCCTGCTCTC CACGCTCACC 
TTCCCGCTGG CCATCACCGG TGCCTCGGTG GCCCTGCCCG CCGTCCAGGC CGAACTCGGC 
GCCACGCTGA CCGCCGCCCA GTGGGTCGTC AACTCCTACA ACGCCTGCTT CGCCGCCTTC 
CTCGTGTGCG CGGGGTCGGT CGCCGACGCG GTCGGCCGCC GCCGGGTCTA CGCCTTCGGC 
CTCGCCCTGT TCTGCGCCAG CGGTCTGCTG TGCCTGCTCG TCCGGGACGT CACCGCCCTG 
AACCTGCTGC GCGCGGCGGG CGGCGTCGGC GCCGCGGCGG CGGTCGCCGG CGGCAGTTCG 
ATGATCGCCG CGGCCTTCGA GGGCCCCGCG CGGGCCCGGG CCTTCGGCCT GCTGGGCACG 
GTGCTGGGCG CCGGTACCGC GTTCGGCCCG GCCGTGGCCG GACTGCTCGT CGAGAACCTC 
GGCTGGCGGG CCGCGTTCGC CTCCCCGGCC GCCGTGGCCG GGCTCGTCCT CCTCCTCGTG 
CCCCTCCTGC CCGCCGCGCG CGGCACGGGC AGGCCCGTGG ACCGGCTCGG AGCCGTCCTG 
TTCACCTCGG CACTGCTCGC CTCGATCGCC GTCCTGGTGG AGGGACCCGC GCGCGGCCTG 
CCGACGGTGC TCGCGGGGCT GGCCCTGGTC GCGGCTCTGG CGATCGCCTT CGTGCTCGTC 
GAACGCCGGG CCAGCGACCC CCTGGTGGAC CTGGTCCTGC TGGCCAACCG CCGGTTCGTC 
GCCCACGCCC TGGCCGCCGC CGCGTTCATG GCGGTGCTCG TGCCCCTGCT CGTGTACCTG 
CCGTCGTACC TGATCGCCGT GGTGGGGCTG GGCGCCGGTC AGGCCGGGCT GTGGCTGCTG 
ATGCTCACGC TGCCCACCCT CCTGCTGCCC GCCCCGGGCG CGGAACTGGC CGCGCGCCTG 
CCCCACACCG CGGTCGTGGT CGGCGCCCTG CTGCTGTGCG CCGCCGGAGC CACGGGGCTG 
CTCGCGCTGG GGCCCGACGC CACACCGTGG CGGCTGCTCC TGCCGTTCCT GCTGGTCGGA 
GCCGGGGTGG GCCTCACCAA CGGCGTCGTG GACGGAATGG CCATGGGTGC GGTGCCCGCC 
GAGCGGACGG GCGTCGCGGC CGGGGTGTTC AACGCCTCCC GGATCACCGT GGAGACGGTC 
GCCCTCGCCG CGGTCGGGGC ACTCCTGGCC GCGCTCACCG GGGGACGCCT GGAGGGCGAG 
CGGTTCACGG ACGCGTTCCA CGTCGTGGGC CCGGTCCTGG GCGGACTCGC CGTCCTGGCG 
GCGGCCGCGG CCTGGTCCCT CGGAAGAAGG AGGACAACGG AACCGCACGG CCCGCCCCTT 
CGCTGA

Protein sequence

MSTRDRGGIL LLAVLLSTLT FPLAITGASV ALPAVQAELG ATLTAAQWVV NSYNACFAAF 
LVCAGSVADA VGRRRVYAFG LALFCASGLL CLLVRDVTAL NLLRAAGGVG AAAAVAGGSS 
MIAAAFEGPA RARAFGLLGT VLGAGTAFGP AVAGLLVENL GWRAAFASPA AVAGLVLLLV 
PLLPAARGTG RPVDRLGAVL FTSALLASIA VLVEGPARGL PTVLAGLALV AALAIAFVLV 
ERRASDPLVD LVLLANRRFV AHALAAAAFM AVLVPLLVYL PSYLIAVVGL GAGQAGLWLL 
MLTLPTLLLP APGAELAARL PHTAVVVGAL LLCAAGATGL LALGPDATPW RLLLPFLLVG 
AGVGLTNGVV DGMAMGAVPA ERTGVAAGVF NASRITVETV ALAAVGALLA ALTGGRLEGE 
RFTDAFHVVG PVLGGLAVLA AAAAWSLGRR RTTEPHGPPL R