Gene Ndas_2109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2109
Symbol
ID	9245959
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2528078
End bp	2529505
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	70%
IMG OID
Product	sugar transporter
Protein accession	YP_003680040
Protein GI	297561066
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.197372
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGGAG CCAGACAGGC CGGGGACGAG TCGGTTCCGG CGGGGGAGGG CAACATCGTC 
CACGTGACGA TGATCGCCGC GGCCGCGGCG ATGGGCGGTT TCCTGTTCGG CTACGACAGC 
GCGGTCATCA ACGGAGCGGT ACCCGCCATC CAGGAGTACT TCGGAGTGGG CCCCGCCACG 
CTGGGCTTCA CGGTCGCCGC CGCGCTCCTG GGCTGCGTGG TGGGCGCCGC GGTCGCGGGG 
GCCCTGGCCG ACCGCCTCGG CCGCATCCGC ACCATGCAGA TCGCCGGTGT GCTGTTCGCG 
ATCAGCGCCG TCGGCTCGGC GCTGCCGTTC AACGTGTGGG ACCTGACCGC CTGGCGGATC 
CTGGGCGGTG TCGCCATCGG CCTGGCCTCG GTGATCGCCC CGACCTACAT CGCAGAGGTG 
TCGCCCGCGG CCTACCGCGG CCGCCTGGCG TCGTTGCAGC AGCTGGCCAT CGTGCTGGGC 
ATCGCCGCCT CGCAGCTGGT CAACTACGGC ATCGCCCAGA TGGCCGACGG CACCGCGAGC 
GGCATGCTGG GGCCGATCCA GGCCTGGCAG TGGATGCTGG GCGTCGAGGT CCTGCCCGCC 
CTGGTCTACC TGGGGCTGAG CGTGCTCATC CCCGAATCTC CCCGCTACCT GGTGCGCGTG 
GGGCAGACCG AACGCGCCCG CCGCATCCTG GCCGACGTCG AGGGCGGCGG AGCCGAGCGG 
GTGGACAAGC GCATCGGGGA GATCCGCGAG GCGCTGGGCT CGGAGGTCCG GCCCAGGCTG 
AGCGACCTGA CCGGCCGCTA CGGTCTGCTG CCCATCGTGT GGATCGGCAT GGCCGTCTCG 
GCGTTCCAAC AGCTGGTCGG GATCAACGTC ATCTTCTACT ACTCCAGTTC GCTGTGGCAG 
TCGGTGGGGG TGGAGGAGTC GGCCTCGCTG CTGCTGAGCC TGTTCACCTC CATCGTGAAC 
ATCGTGGGTA CGTTCGTGGC GATCCTGCTG GTGGACCGGG TCGGCCGCAA GCCGCTGCTG 
CTGGTGGGCT CGGCCGGGAT GACGGTGGCG CTGGCGCTGG CCGCCTACGC CTTCAACCAC 
GCGGTGGTGC GGGGCGAGGA GGTGACGCTG TCGTTCGGCT GGGGCGCGGT GGCGCTGACC 
GCGGCCAGCC TGTTCGTGCT CTTCTTCGCG CTGTCGTGGG GCGTGGTCGT GTGGGTGCTG 
CTGGGGGAGA TGTTCCCGCT GCGCATCCGT GCCGCGGCGA TGGGCGTGGC CACCGCGACC 
CAGTGGCTCA CCAACTGGCT CATCACCGTG AGCTTCCCGA GCCTGCGCGA CTGGAGCCTG 
AGCGGCACGT ACCTGATGTA CGCGTTCTTC GCGCTGGTGT CGTTCTTCTT CGTGCTGAGG 
TTCGTGAAGG AGACCCGCGG CAAGACCCTG GAGGAGATGC GGGGCTGA

Protein sequence

MSGARQAGDE SVPAGEGNIV HVTMIAAAAA MGGFLFGYDS AVINGAVPAI QEYFGVGPAT 
LGFTVAAALL GCVVGAAVAG ALADRLGRIR TMQIAGVLFA ISAVGSALPF NVWDLTAWRI 
LGGVAIGLAS VIAPTYIAEV SPAAYRGRLA SLQQLAIVLG IAASQLVNYG IAQMADGTAS 
GMLGPIQAWQ WMLGVEVLPA LVYLGLSVLI PESPRYLVRV GQTERARRIL ADVEGGGAER 
VDKRIGEIRE ALGSEVRPRL SDLTGRYGLL PIVWIGMAVS AFQQLVGINV IFYYSSSLWQ 
SVGVEESASL LLSLFTSIVN IVGTFVAILL VDRVGRKPLL LVGSAGMTVA LALAAYAFNH 
AVVRGEEVTL SFGWGAVALT AASLFVLFFA LSWGVVVWVL LGEMFPLRIR AAAMGVATAT 
QWLTNWLITV SFPSLRDWSL SGTYLMYAFF ALVSFFFVLR FVKETRGKTL EEMRG