Gene Caul_1602 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1602
Symbol
ID	5899057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1691510
End bp	1692736
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	71%
IMG OID	641562089
Product	Bcr/CflA subfamily drug resistance transporter
Protein accession	YP_001683229
Protein GI	167645566
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00710] drug resistance transporter, Bcr/CflA subfamily [TIGR00880] Multidrug resistance protein

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.940845
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACG CCGCCCAGCC CGTTCCCGCC GTCATCCCCT GGCGGCTCGT CCTGATGCTC 
GGCGCTCTGA CCGCCTTCGC CCCGATGTCG ATCGACATGT ACCTGTCGAG CATGCCCGAG 
ATCGGCCGGC GGCTGCACGC CGGGGCCGAC GACGTCCAGG CCACCCTGGC GGCCTTCTTC 
GCCGGCATGG CCATCGGGCA ATTCCTCTAT GGACCGGCGT CGGACCGTTT CGGTCGCCGG 
CCGCCGTTGC TGCTGGGCAT CGGCATCTAT GTCGCCGCCT CCGTGGTTTG CGCCCTGGCC 
CCCTCCATCG AGGTGCTGAT CGCCGCCCGC TTCGTCCAGG CCCTGGGCGG CTGCGCGGGG 
GCGGTGGTGG CGCGGGCGGT GGTCCGTGAC CGCTTCAACC ACGCCGACAC GGCCCGCGTG 
CTGTCGCTGA TGACCTTGAT CATGGGCCTG GCCCCGGTGC TGGCCCCGCA GCTGGGCGGG 
GTGATCCAGT TCTTCGCCGG CTGGCGGGGC GTGTTCTGGT CGCTCGTGGT GTTCGGCCTG 
CTGATCGGCC TGTGGATCGC CCTGGGCCTG AGCGAGAGCC GCTCCGAGGC CACCGCCGTC 
CAGGCCCGCT CGGAGAACCC GTTCAAGGCC TATGGCGCGC TGCTGAGCCA GAAGCGGCTG 
GTCGGCTACG GCCTGGCGGG GGCCCTGAAC GGCGCGACCC TGTTCACCTA CATCTCGACC 
GCCCCGGACC TGGTGATGGG GACCTATGGC CACACGCCGC TGGTGTTCAA CCTGATCTTC 
GCCTTCAACG CCGTGGGCAT CATCGGGGCC AGCCAGGTCA ACCGGCTGCT GCTGCGTCGC 
GCGACGCCGG ACAGGGTGCT GGTGCGGGCC AGCATCGCCT CGATCGTCGC CGCCTTCCTG 
CTGGCCGCCG CCGCCTGGAC CGGAGTGGGC GGACAGTTCA CGGTCCTGCC GCTGCTGTTC 
GCCGCCCTGT CGAGCTACGG CCTGATGGCC GGCAACACGA TGGCCGGGGC GCTCAGCGTC 
GATCCCAAGC GCGCCGGTTC GATCTCGGCC CTGATGGGCG GAGCCTCGTT CGCGGCCGGC 
GCCCTGGCCG CGTGGATCGG CGGCCTGCTG CATGACGGCA CGGCCCGCCC CGTGGCGGCG 
GTGATGTTCG CCTGCCTGAT CGGCTCCAGC CTGGCGATCT TCGGCCTGGC GGTCCCGAAG 
GGGTTGCGGG GCAAGGCGAG GGTTTGA

Protein sequence

MTDAAQPVPA VIPWRLVLML GALTAFAPMS IDMYLSSMPE IGRRLHAGAD DVQATLAAFF 
AGMAIGQFLY GPASDRFGRR PPLLLGIGIY VAASVVCALA PSIEVLIAAR FVQALGGCAG 
AVVARAVVRD RFNHADTARV LSLMTLIMGL APVLAPQLGG VIQFFAGWRG VFWSLVVFGL 
LIGLWIALGL SESRSEATAV QARSENPFKA YGALLSQKRL VGYGLAGALN GATLFTYIST 
APDLVMGTYG HTPLVFNLIF AFNAVGIIGA SQVNRLLLRR ATPDRVLVRA SIASIVAAFL 
LAAAAWTGVG GQFTVLPLLF AALSSYGLMA GNTMAGALSV DPKRAGSISA LMGGASFAAG 
ALAAWIGGLL HDGTARPVAA VMFACLIGSS LAIFGLAVPK GLRGKARV