Gene Caul_1648 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1648
Symbol
ID	5899103
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1727596
End bp	1728843
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	67%
IMG OID	641562137
Product	major facilitator transporter
Protein accession	YP_001683275
Protein GI	167645612
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00880] Multidrug resistance protein

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0811808
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAAGG CCATCAGCAG CAACCAACGC CAGGCGGCGC TCGGCTTCAT CTTCGTCACC 
GCCTGCATGG ACGTGCTGTC GCTGGGCGTG ATGATCCCGG TGCTGCCCGA ACTGATGAAG 
CGCTTCAACG GCGGCGACAC CGCCGCGACC GCCCTGTGGA TGGTGCTGTT CGCCACCACC 
TGGGGCGTGA TGCAGTTCTT CTGCGGACCC ATCCTGGGCC TGATGTCGGA CCGCTTCGGC 
CGCCGGCCGG TGATCCTGAC CTCGATCTTC GGCCTGGGCG TCGATTTCCT GTTCATGGCC 
TTCGCGCCGA CGATCTGGTG GCTGTTCGTC GGCCGGGTGT TCAACGGCAT GACCGCCGCC 
AGCTTCTCGA CCGCCGGGGC CTATGTGGCC GACGTCACCA AGCCGGAGGA CCGGGCCAAG 
GGCTTTGGCC TGATGGGCGC GGCGTTCGGC GTGGGCTTCA CCTTTGGCCC GGCGCTGGGG 
GCCGTGCTGT GGGGTTTCGA CCATCGCCTG CCGTTCCTGG TCTGCGCGGG CCTGGCCCTG 
TGCAACTGGC TCTATGGCTT CTTCGTGCTG CCGGAATCCC TGCCGCCGGA GAAGCGAATC 
GCGCGTTTTG ACTGGAAGAA AGCCAACCCC GTCGGCTCGC TGAACCTGCT TAGGAGCAAG 
CCCAACCTGC TGGGCCTGGC CGGCGTCGGC TTCCTGTTCC AACTGGCGCA CAACGTCCTG 
CCCAGCGTCT TCGTCCTCTA TATGGGCTAT CGCTATCACT GGCCGGTGCT GATCATCGGC 
CTGACCCTGA TGGGTAGCGG GATGGCGGGG ATCCTGCTGC AGAGCCTGCT GGTCGGCCCG 
ATCGTCAAGA AGGTCGGCGA GCGCGGCGCG CTGTTGATCG GCCTGTTCTC TGGCTGCGTC 
GGCTTCATGA TCTATGGGCT GGCCCCTGTC GGTTGGCTCT ATCTATGCGG CCTGCCGATC 
TTCGCCTTCT CGGGCCTGAT CCAACCCGGC TTGCAAGGGC TGATGACCCG GCGGGTCCAG 
CCGTGGGAGC AGGGCCAGCT CCAGGGCGCG AACGCCGCGA TGATGGGCGT CACCGCCATC 
GTCGGACCGA CGCTCTACCT GCTGCCGTTC GCTTGGGCCA TCCGCCACGA CGCCAGCCTG 
CACATGCCCG GCCTGCCGGT GCTGATCGCC GCCCTGCTGC TGCTGGCGGC CACGGTGTTG 
GCGATCCGCG TGGCGCGGCC CGTGGCGGTG GAACCCAGCG TCGCCTGA

Protein sequence

MIKAISSNQR QAALGFIFVT ACMDVLSLGV MIPVLPELMK RFNGGDTAAT ALWMVLFATT 
WGVMQFFCGP ILGLMSDRFG RRPVILTSIF GLGVDFLFMA FAPTIWWLFV GRVFNGMTAA 
SFSTAGAYVA DVTKPEDRAK GFGLMGAAFG VGFTFGPALG AVLWGFDHRL PFLVCAGLAL 
CNWLYGFFVL PESLPPEKRI ARFDWKKANP VGSLNLLRSK PNLLGLAGVG FLFQLAHNVL 
PSVFVLYMGY RYHWPVLIIG LTLMGSGMAG ILLQSLLVGP IVKKVGERGA LLIGLFSGCV 
GFMIYGLAPV GWLYLCGLPI FAFSGLIQPG LQGLMTRRVQ PWEQGQLQGA NAAMMGVTAI 
VGPTLYLLPF AWAIRHDASL HMPGLPVLIA ALLLLAATVL AIRVARPVAV EPSVA