Gene Caul_0241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0241
Symbol
ID	5897515
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	267094
End bp	268665
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	69%
IMG OID	641560725
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_001681876
Protein GI	167644213
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.232516
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCC AGACCTTCAC CGACACCGAG CGCCGGCTGA CGCTGGGCGC CCTGATGATC 
GTCTTTCTGC TCAGCGCCCT GGACCAGACG GTGGTCTCCA CGGCCATGCC GCGGATCATC 
GCCGAGCTCA ACGGCCTGAC GCTCTATGCC TGGGTCACCA CCGCCTACCT GCTGACCTCA 
ACGGTGATGG TGCCGATCTG GGGCAAGCTG GGCGACATCT ATGGCAGGAA GCCCGTCCTG 
CTGGCCGGCA TCGGCATCTT CCTGGCCGGC TCATGGCTGG CGGGCCTGTC GGGCGAGTTC 
GGCGACCTGC TGGGCATGAG CGGCATGGTC CAGCTGATCG TCTTCCGCGC CTTGCAGGGC 
ATCGGCGGCG GGGCGCTATT CACCACCGCC TTCGCGATCA TCGCCGACCT TTATCCGCCG 
CGGGAGCGGG GCAAGTTCGC CGGCATCTTC GGTTCGGTGT TCGGCCTGGC CAGCGTGCTG 
GGTCCGCTGA TCGGCGGCTA TTTCACCGAC CACGGGACGG TGCAGCTGGG CTCGCACCTG 
ATCGCCGGCT GGCGCTGGGT GTTCTATGTC AACCTGCCGC TCAGCCTGCT GTCGCTGTTC 
ATGATCCTGG TCAAGATGCC GCCGCTCGAG CACCGGCGCT CCGGCGCGGT CGACTACGTC 
GGCGCCATCC TGCTGGTCGC CGCCTTCGTG CCGCTGCTGC TGGCGCTCAG CCTGGGCGGT 
CACGACTTCG CCTGGAGCTC GCCCCAGAGC CTGGGCCTGC TCGCCTTCGC CGCCGTCGCG 
CTGATCCTCT TCCTCTACGC CCAGACCAAG GCCAGCAATC CACTGGTGCC GCTGCGGCTG 
TTCGGCAACC GGGTGTTCGC CACCGCCAAC CTGGCCGGCT TCCTGATCTC CATGGCCTTC 
CTCGGCGTGG TGACCTTCCT GCCGCTCTAC ATGCAGCTGG GCCTGGGCGT CGACGCCACG 
ACCAGCGGCC TGGCCATCCT GCCGCTGATG GGCGGGCTGA TCGTCGCCTC GACCGCCGCC 
GGCCAGATGG TCAGCAAGAC CGGGCGCTAC AAGCCGCTGA TGATCGTTGG CGCCGTGTTG 
CTGATGACCG GGGTCTGGCT GCTCAGCCGG GTGACCGTCC ACACCACCCT GCCCGACCTG 
TGCTGGCGGA TGGCCATCGT CGGCCTGGGC CTGGGACCGG GCCAGAGCCT GTTCAACATC 
GCCACCCAGA ACGCCGTCGA GGTGCGCGAC ATCGGCGTGG CCACCAGTTC CAACCAGTTC 
TTCCGCCAGA TCGGCTCGAC GATCGGCGTG GCGGTGTTCG GCGCCCTGCT GACCCATCGC 
CTGGCCAACG AGGGCCAGGG CCTGGACCTG GGCGCCCTGC AGGGTCTGGC CCTGAAGGCC 
ACCGCGACCG GCGCCGCCCG TCACGCCGAC CCGGCCCTGG CCCAGGCCCT GACCCACGCG 
ATCACCGGCG TGTTCTTCGC GGGCCTGTTC GTGATCGGCC TAGGCTTGGT GGTGATCTTC 
CTGATCCCAG AGCTGCCGCT GCGCGGCCGG CAACCAGGGC CGGAGCCGGT GCTGGAGAAG 
GAGCCGGTTT AG

Protein sequence

MTTQTFTDTE RRLTLGALMI VFLLSALDQT VVSTAMPRII AELNGLTLYA WVTTAYLLTS 
TVMVPIWGKL GDIYGRKPVL LAGIGIFLAG SWLAGLSGEF GDLLGMSGMV QLIVFRALQG 
IGGGALFTTA FAIIADLYPP RERGKFAGIF GSVFGLASVL GPLIGGYFTD HGTVQLGSHL 
IAGWRWVFYV NLPLSLLSLF MILVKMPPLE HRRSGAVDYV GAILLVAAFV PLLLALSLGG 
HDFAWSSPQS LGLLAFAAVA LILFLYAQTK ASNPLVPLRL FGNRVFATAN LAGFLISMAF 
LGVVTFLPLY MQLGLGVDAT TSGLAILPLM GGLIVASTAA GQMVSKTGRY KPLMIVGAVL 
LMTGVWLLSR VTVHTTLPDL CWRMAIVGLG LGPGQSLFNI ATQNAVEVRD IGVATSSNQF 
FRQIGSTIGV AVFGALLTHR LANEGQGLDL GALQGLALKA TATGAARHAD PALAQALTHA 
ITGVFFAGLF VIGLGLVVIF LIPELPLRGR QPGPEPVLEK EPV