Gene Ndas_3526 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3526
Symbol
ID	9247395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4234188
End bp	4235621
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	74%
IMG OID
Product	benzoate transporter
Protein accession	YP_003681433
Protein GI	297562459
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.149229
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAACCC TCGTCCGTCT TGTCGGCCTC GTGGCCCCCG CGCCCGCCGT CGCGGCCGGT 
CTGGTCGCCG TGCTGGTCGG GGTGACCAGC TCGGCGGCGA TCGTGTTCAC CGCGGCCGAG 
GCCGCCGGTG CCTCCTCCGG GCAGACCGCC TCGTGGATGC TGGCCCTGGG TGTGGGGATG 
GCGGTGACCT GTGTGGGACT GTCCCTGCGC CACCGGGCCC CGATCGTGAC CGCCTGGTCC 
ACGCCCGGCG CCGCGCTGCT GGCGGTGGGG CTGGACGGGG TGACGATGGC GCAGGCGGTG 
GGGGCGTTCC TGTTCTCGGC CGCGCTGATC ACCCTGAGCG GCGTCACCGG GTGGTTCGAG 
AGGGTCATGG ACCACGTGCC GGTGCCGCTC GCGGCGGGGC TGCTGGCCGG GGTGCTGCTC 
CAGTTCGGCA TGGGGCTGTT CACGAGCATG GAGGACGACT TCGCGGTCGT GTTCACCATG 
TTCGCGGCGT ACCTGCTGAG CCGCCGGTGG CTGCCGCGCT ACGCGGTCAT CCTGTCCCTG 
GTCGCGGGCG GTGTCGCCGC GGCGCTGCGC GGGACCCTGG ACCTGGGCGG GGTGACCCCG 
TCGCTGGCCC GGCCGGTGTT CGTGGCGCCC GAGTTCTCCT GGCAGGTGCT GGTGAGCGTG 
GGGCTGCCGC TGTTCGTGGT GACCATGGCC TCGCAGAACC TGCCGGGGGT CGCGGTACTG 
CGGGGCGACG GCTACCGGGT GCCGATCTCG CCGGTGATCG GGTGGACCGG GGCGACCAAC 
CTGGTACTGG CGCCGTTCGG GTGCTTCGGG ATGAACCTGG CCGCGATCAC CGCGGCCATC 
TGCACGGGAC CGCAGGCGCA CCCCGACCGC GAGCGCCGCT ACCTGGCCGG GGTGTGGGCG 
GGGGTCTTCT ACCTGTGCGT GGGGGTCTTC GGGGCGACGG TGGCGTCGCT GCTGGCCGCG 
CTGCCGCCGC CGCTGATCCT GGGGATCGCC GGGCTGGGCC TGCTCGGAAC GATCGGGGGT 
TCGCTGGCGT CCGCGCTGGG GGACGAGCGC TCCCGGGAGG CCGCGGTGGT GACCTTCCTG 
GCCACGGCGT CGGGGTTCAC CCTGTTCGGT GTGGGGTCGG CCTTCTGGGG TCTGCTGGCG 
GGTGCGCTGA CGCTGGCGGT GACCCGTTCC TGGCGCCGGT CGCGGCACAC GGCTTCGGGC 
GGCGGTGCCG GGCAGGACAC CGAGGACGCG CGGGAGGCCG ACGAGACCGC GGAGGCCGTC 
CGGGGAGAGG GCGGCGGAGC GCGGGAGGCG GCCGGAACAC CGGCGACCCC GATACGGACG 
GCCGACGGGG CTCACGAGAC GGGTGGGACT GGACAGGCCG GAGAGGACGG AACGACCACC 
GAGGCGCAGG GGCCCGGTGA TCCCGGTGCG GACAGCCGGT CGGCCCGCGG TTGA

Protein sequence

MRTLVRLVGL VAPAPAVAAG LVAVLVGVTS SAAIVFTAAE AAGASSGQTA SWMLALGVGM 
AVTCVGLSLR HRAPIVTAWS TPGAALLAVG LDGVTMAQAV GAFLFSAALI TLSGVTGWFE 
RVMDHVPVPL AAGLLAGVLL QFGMGLFTSM EDDFAVVFTM FAAYLLSRRW LPRYAVILSL 
VAGGVAAALR GTLDLGGVTP SLARPVFVAP EFSWQVLVSV GLPLFVVTMA SQNLPGVAVL 
RGDGYRVPIS PVIGWTGATN LVLAPFGCFG MNLAAITAAI CTGPQAHPDR ERRYLAGVWA 
GVFYLCVGVF GATVASLLAA LPPPLILGIA GLGLLGTIGG SLASALGDER SREAAVVTFL 
ATASGFTLFG VGSAFWGLLA GALTLAVTRS WRRSRHTASG GGAGQDTEDA READETAEAV 
RGEGGGAREA AGTPATPIRT ADGAHETGGT GQAGEDGTTT EAQGPGDPGA DSRSARG