Gene Noca_3502 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3502
Symbol
ID	4595601
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	3710699
End bp	3712123
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	74%
IMG OID	639778110
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_924689
Protein GI	119717724
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGCTC TCGACGTGGC GGTCGCACCG GCCCCGACGC GGTCCCGACG CTCGCCGGTG 
TGGCTCGCCG TCCTCGCGGC CTCGCTGCCG ATGTTCATGG CCACCCTTGA CAACCTGGTG 
ATGACCAGCG CGCTGCCGGT GATCCGGACC GACCTCGGCT CGTCGGTCAA CCAGCTCTCC 
TGGTTCATGA ACGCCTATAC GCTGACCTTC GCGACCTTCA TGCTCCCCGC CGCGACCCTC 
GGCGACCGGC TCGGCCGACG GCGGATGATG CTCGCGGGCC TGACCGTCTT CACGCTCGCG 
TCGGTCGCGT CGGCGCTGAG CACCACCTCG GAGGCGCTGA TCGCGGCGCG CGCCGTGCAG 
GGCCTCGGTG CGGCGGCGAT CATGCCGCTC TCCCTGACCC TGCTCGCCTC CGCCGTGCCC 
CCGGCCCTGC GCTCGGCCGC CATCGGGATC TGGGGTGGCG TCAGCGGGCT CGGTGTCGCG 
CTCGGTCCCG TGGTCGGCGG CGCGGTCGTC GAGGGCGTCA GCTGGCAGGC GATCTTCTGG 
CTCAACGTCC CGGTGGCCGC GGTCGCGGGG CCGCTGCTGG TCCTCGGGGT GCGCGAGTCG 
CACGGCGCCT GGCAGCGGCT CGACCTGGTC GGGACCCTGC TCGTCGGCGG CGCGGTCCTC 
CTCGGGATCT GGGGCATCGT GCACGGCAAC GACGACGGCT GGGGCGATCC GCGGGTCCTC 
GGCCCGCTCG TGGTCGCTGC GCTGCTGGCG CCGGCGTACC TGCGCTGGGC CCGAGGTCGT 
TCCCACGCGG TCCTGCCGCT GCGGCTGTTC GCCGCGCGTG GGTTCTCCGT CGCGAACGTG 
ATCGCCCTGT TCTTCACCAT CGGGATGTTC GGGACGGTCT TCCTGCTCAC GCAGTACCTC 
CAGGTGGTCC AGGGCTACAG CCCGCTCGCC GCTGGCGTGC GCACGCTGCC GTGGACGGCC 
GCACCGATGG TGGTCGCGCC GCTCGCCGGC CTGCTGGCGC CGCGCACCGG CTTGCGGGCG 
CTGCTCCTGA CGGGGCTGGC GCTCCAGACC GGGTCGCTGG TCTGGTTCGC GGTGCTCACC 
GAGACCGCTG CGGGCTACCC GGCGTTCATG CCGGCGCTGC TGATGGCCGG GGTCGGGATG 
GGGCTGACGT TCGCACCGAT GGCGACTGCC GTGCTCGAGG GCCTGCCCGA GGAGGACTTC 
GCCATGGCCA GCTCGGCCAA CTCCACGATC CGCGAGTTCG GGGTCGCGCT CGGCATCGCC 
GTGCTCACGG CGGTCTTCCT CGGCAACGGC GGCGCGATCG AGCCGCTCGG GTACGACGGC 
GCGATCGGCC CGGCGCTGCT GACCGGCGCC GGGGCCGTGG CGGTTGCGAC ACTCGCCGCG 
CTGCTCGCTC CCGGCAGGGG GAGGCGGGCC ACCCCTCGGG CCTGA

Protein sequence

MTALDVAVAP APTRSRRSPV WLAVLAASLP MFMATLDNLV MTSALPVIRT DLGSSVNQLS 
WFMNAYTLTF ATFMLPAATL GDRLGRRRMM LAGLTVFTLA SVASALSTTS EALIAARAVQ 
GLGAAAIMPL SLTLLASAVP PALRSAAIGI WGGVSGLGVA LGPVVGGAVV EGVSWQAIFW 
LNVPVAAVAG PLLVLGVRES HGAWQRLDLV GTLLVGGAVL LGIWGIVHGN DDGWGDPRVL 
GPLVVAALLA PAYLRWARGR SHAVLPLRLF AARGFSVANV IALFFTIGMF GTVFLLTQYL 
QVVQGYSPLA AGVRTLPWTA APMVVAPLAG LLAPRTGLRA LLLTGLALQT GSLVWFAVLT 
ETAAGYPAFM PALLMAGVGM GLTFAPMATA VLEGLPEEDF AMASSANSTI REFGVALGIA 
VLTAVFLGNG GAIEPLGYDG AIGPALLTGA GAVAVATLAA LLAPGRGRRA TPRA