Gene Caul_2689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2689
Symbol
ID	5900144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2922647
End bp	2924182
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	65%
IMG OID	641563180
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_001684314
Protein GI	167646651
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily [TIGR00880] Multidrug resistance protein

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0761069
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGGG CCGGCAACGG CAAGGGCGAC GCGGCCAACC GGGTCCCGAT CACGGTCGCC 
GTCATGCTGG CGACGATCAT GAACTCGCTG GACACGACGA TCGCCAACGT CGCCCTACCC 
CACATCCAGG GCAGCGTCTC GGCTTCGGCC GAGCAGATCA CCTGGGTGCT GACCTCGTAT 
ATCGTCGCCG CGACGATCAT GACCCCGCTG ACCGGCTTCT TCGCCGATCG GGTCGGCCGC 
AAGATGGTGT TCCTGGTGTC GATCGCCGGT TTCACCGTCG CCTCGATGCT GTGCGGCGTC 
GCCACCAGCC TGGTCGAGAT CGTTCTGTTC CGCCTGCTGC AGGGCCTGTT CGGCGCCGCT 
CTGATCCCGC TCTCCCAAGC TGTGCTGCTC GACATCAACC CGCCCGAGAA GCACGGCTCG 
GCCATGGCCA TCTGGGGCGC CGGGGCGGTG CTGGGGCCAA TCCTCGGGCC GGCCCTGGGC 
GGCTGGCTGA CCGACAATCT CGACTGGCGC TGGGTGTTCT TCATCAATCT GCCGATCGGC 
ATCCTGGCCT TCTGCGGGGT GTTCTTCTTC CTGTCTGAAA AGAAGAGCCC CGAGAAGAAG 
CGGTTCGACG TGCTGGGCTT CGCCAGCCTG GCCCTGGCCA TCGGCGGCTT CCAGATGATG 
CTCGATCGCG GTCCCAGCCA GGACTGGTTC GCCTCGTCCG AAATCTGGCT CTACCTGATC 
GTCGGGATCA TCGCCCTGTG GATCTTCGGC GTGCAACTGG CCACCGCAGC CAAGCCGTTC 
GTCGACCGCG CCCTGCTGGC CGATGTCAAT TTCATCACCT CCTGCGTGTT TGGCTTCTTC 
ATCGGCATTC TGCTCTACAG CGTGCTCGCC CTACTGCCGC CGATGATGCA GAACCTGATG 
GGCTATCCGG TGGCCTTCAC GGGCCTGGTC AGCATGCCGC GCGGCATCGG CTCGTTCATC 
GCCATGTTCG CCGTCGGCCA ATTGATCGGC CGCATGAGCA TCAAGCTGAT CCTGTTGATC 
GGCCTGGCGG TCAGCGCCGT CTCGCTGTGG ATGATGACCC AGTTCACCCT GGGCATGGAC 
ACCCGCCTGA TCATCGTCTC GGGGTTCCTG TCCGGCGTCG GCACCGGCCT GATCTTCGTG 
CCGCTCAGCA CCATCGCCTT CGCCACGGTT CGCCCGCAGC ACCGGGCCGA AGGCGCGGGC 
CTGTTCACCC TGATCCGCAA CATCGGCTCG GCCGCCGGCA TCTCGATCAT GCAGGCCCGC 
TTCGTCAGCG GCATCGAGGT CCACCACGCC AAGCTGGTCG AGCACGCCCG ACCCGACAAT 
CCGCTGTTCC ACGCCTATGC GCCGCTGGTC TTCCAGGCCC AGGACGCCAT GGCCCGGTTC 
AACGGCGTCA TCACCCGCCA GGCCTCGATG CTGTCCTATA TCGACGACTT CCAGCTGATG 
CTGGGCATCA CCATCCTGTG CGCGCCCATG ATCCTCCTGA TGCGAACCCC CAAGAAGACC 
TCGGGGGGAG AGACCGTCCA TGTCGCCGAA CACTAA

Protein sequence

MTGAGNGKGD AANRVPITVA VMLATIMNSL DTTIANVALP HIQGSVSASA EQITWVLTSY 
IVAATIMTPL TGFFADRVGR KMVFLVSIAG FTVASMLCGV ATSLVEIVLF RLLQGLFGAA 
LIPLSQAVLL DINPPEKHGS AMAIWGAGAV LGPILGPALG GWLTDNLDWR WVFFINLPIG 
ILAFCGVFFF LSEKKSPEKK RFDVLGFASL ALAIGGFQMM LDRGPSQDWF ASSEIWLYLI 
VGIIALWIFG VQLATAAKPF VDRALLADVN FITSCVFGFF IGILLYSVLA LLPPMMQNLM 
GYPVAFTGLV SMPRGIGSFI AMFAVGQLIG RMSIKLILLI GLAVSAVSLW MMTQFTLGMD 
TRLIIVSGFL SGVGTGLIFV PLSTIAFATV RPQHRAEGAG LFTLIRNIGS AAGISIMQAR 
FVSGIEVHHA KLVEHARPDN PLFHAYAPLV FQAQDAMARF NGVITRQASM LSYIDDFQLM 
LGITILCAPM ILLMRTPKKT SGGETVHVAE H