Gene Noca_2169 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2169
Symbol
ID	4599076
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	2320036
End bp	2321700
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	66%
IMG OID	639776771
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_923364
Protein GI	119716399
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCAGG CACGCCCCCC GAGGTCGCAG TCGCAGAACG GTCGAAGCGA AACTCCTTCC 
GCGTCTCCTG GGGTAATCGG AACCCAACCC GAGATGCCGC ACCTGACCCA CCGGCAGATT 
GTCACGGTGC TCGTCGGATT GATGCTGGGA ATGCTCGTCG CCGCGTTGTC GCAGACGATC 
GTGGCGACAG CTCTACCGAC GATCGTCGGT GAGCTGGGCG GGCAGGACCA ACTGGCCTGG 
GTGGTCTCGG CGACACTGCT GACCGCGACC GCGTCCACAC CCATCTGGGG AAAGCTCTCT 
GACCTCTACG GCCGCAAGAT CATGTTCCAA GCGGCCATCG CGATCTTCCT CGTCTCCTCC 
CTCGCAGCAG GTTTCTCGCA AAACATGGCC CAGCTCGTTT CGTTCCGAGC GGTGATGGGT 
ATCGGTGTCG GCGGCTTGAT GGCCTTGTCC CAGGCCATCA TCGGTGACGT CGTCAGTCCG 
CGGGAGCGCG GGCGGTACCA GGGCTACATC GGTTCGGTGT TCGGGCTCGC CACGGTGGCG 
GGGCCGCTGT TGGGTGGCTT CCTGGTCGAG CACCTGTCGT GGCGTTGGTG CTTCTGGGTC 
GGGATCCCGA TCGGGATCGT CGCGCTCGTG GTGACCGAAC GGGTTCTCCA GCTCCCGTTC 
CCGCGCCGCC GCCATGCCAT CGACTGGCTC GGCGCTTTCT TGATCGTGGC CGGGGTATCC 
GCCCTGCTGC TCGTCCTGTC GCTTGGCGGC AAGGAGTTCG CCTGGAACTC CGCATGGACC 
TATGGCTTGA CCGCCGCAGC GATCGTCCTC CTCGCCCTTG CTGTGGTCCA GGAACGCCGA 
GCTGCCGAGC CGATCATGCC GCCACGCCTG TTCGCCAACC ACACCTTCGT GATCACGAGC 
CTGGCCGGCT TCGTCATCGG GGTGGCCATG TTCGGCGCCA TCATCTTCCT GCCGCAGTAC 
CTCCAGATCG TCAAGGGCGA ATCGCCGACC GCCTCCGGTC TGCAGACACT CCCCCTCATG 
GTGGGACTGC TGCTCACCTC GATCGGATCC GGTCGGATCA TCACCCGCAC CGGTCGCTAC 
AAGATTTTCC CCGTCGCCGG GATGTTCATC GCCGCCATCG GGCTGGCATT GATGAGCACG 
CTGGACGTGG ACACGTCGCT GTGGGTCGCC GGGATCTACA TGTTCGTGAC CGGCTTCGGG 
ATCGGCATGA CGATGCAGGT GCTGGTACTC GCCACCCAGA ACGCCGTACC CCACGACGAC 
CTGGGAGTGG CGACCTCAGG CGCGACATTC TTCCGTTCCC TGGGCGGCGC GATGGGTGTC 
GCCATGTTCG GCGCCCTGCT TACGCACCGC CTCCGCGACA CCATCCCGGC CCACCTCGCC 
TCAGCCGGCA TCACACCCGA CCAGATGCCG CAGGGATCAC CCACCCAGGC CACCCCCCAA 
CAGATCGATC AACTACCTGA CGCCATCCAC GCCGCGGTCA CCGGTGGTTT CGCGGAAGCG 
CTCCAGACGA CCTTCCTCGC CGCCGTGCCC TTCGCCCTCG CCGGATTCGT GATCCTCCTC 
TTTTTGCACG AGACACCACT GCGACACAGC CGCGGGACCG CCCGCGAGGA CGACAGCCGC 
GGAGCCGGGA GTCTCGTGGC CGATACCTCT ACCCACGGCG AGTGA

Protein sequence

MKQARPPRSQ SQNGRSETPS ASPGVIGTQP EMPHLTHRQI VTVLVGLMLG MLVAALSQTI 
VATALPTIVG ELGGQDQLAW VVSATLLTAT ASTPIWGKLS DLYGRKIMFQ AAIAIFLVSS 
LAAGFSQNMA QLVSFRAVMG IGVGGLMALS QAIIGDVVSP RERGRYQGYI GSVFGLATVA 
GPLLGGFLVE HLSWRWCFWV GIPIGIVALV VTERVLQLPF PRRRHAIDWL GAFLIVAGVS 
ALLLVLSLGG KEFAWNSAWT YGLTAAAIVL LALAVVQERR AAEPIMPPRL FANHTFVITS 
LAGFVIGVAM FGAIIFLPQY LQIVKGESPT ASGLQTLPLM VGLLLTSIGS GRIITRTGRY 
KIFPVAGMFI AAIGLALMST LDVDTSLWVA GIYMFVTGFG IGMTMQVLVL ATQNAVPHDD 
LGVATSGATF FRSLGGAMGV AMFGALLTHR LRDTIPAHLA SAGITPDQMP QGSPTQATPQ 
QIDQLPDAIH AAVTGGFAEA LQTTFLAAVP FALAGFVILL FLHETPLRHS RGTAREDDSR 
GAGSLVADTS THGE