Gene Caul_3188 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3188
Symbol
ID	5900643
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3451921
End bp	3453486
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	67%
IMG OID	641563692
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_001684813
Protein GI	167647150
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.477871
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGACC AGGACTCCTC TCCCGCAGCC GCCAGCGGCC CAGCGCCGCT GACCGGCATG 
ATGCTGGCGG TCACCTCGAT CGCCCTGGCG CTGGGCACTT TCATGCAGGT GCTGGACAGC 
ACCATCGCCA ACGTCTCGAT CCCGACCATC GCCGGCAATC TGGGGGTCAG CACCAGCCAG 
GGCACCTGGG TGATCACCTC GTTCGCGGTG GCCAACGGCG TCTCGGTGCC GCTGACCGGC 
TGGCTGATGG GTCGCTACGG CGTCGTGAAG ACTTTCGTGG TCTCGGTGCT GCTGTTCACC 
CTCGCCTCGT TCCTGTGCGG CGTTTCGTGG AACCTGCCGT CGCTGATCGG CTTTCGGATT 
CTGCAGGGCC TGGTCTCGGG TCCGATGATC CCGGGCTCGC AGGCCCTGCT GATCATGATC 
TTTCCGGCCA GCAGGCGGGG CACGGCCCTG GCCATCTGGT CGATGACCAC ACTGGTGGCG 
CCGATCTGCG GCCCGATCCT GGGCGGCTAC ATCTCCGACA ACATCGCCTG GGAATGGATC 
TTCCTGATCA ACGTACCCGT CGGCCTGCTC TGCGCCTTCC TGTGCTGGCG CGGGATGAAC 
AACCGCGAGA CCCCGACCCG CAAGGTGCCG ATCGACACCA CCGGCTTCAT GCTGCTGCTG 
GTCTGGGTCG GCGCCCTGCA AGTGATGCTC GACACCGGCA AGGACGCCGA CTGGTTCAAC 
TCGCCGGCCA TCGTCGTCGA GACCCTGGTG GCCATCGTCG GCTTCATCGC CTGGGTGATC 
TGGGAGCTGA ACGAGAAGCA TCCGATCGTC GACCTGTCGC TGTTCAAGTC CAAGAACTTC 
GCCCTGGGCA CGGTCGCCTT CTGCCTGGGC TACGCGGTGT TCTTCGGCAG CAATCTGCTG 
CAGCCGCTGT GGCTGCAAAC CCAGATGCAC TACATCGCCA CCTGGGCCGG CCTGGTCGCC 
GCCCCCAGCG GCGTGGTGGC CGTGCTGCTG ACCCCGTTCG CCGCCCGCAT CATGCAGAAG 
GTCGACGCCC GCTGGACCGC CACCCTGTCG CTGGCCGCGT TCGCCCTGTC GTTCTACATG 
CGCTCGGGCT TCACGCCGGA CGTGGACTTC AAGGCCCTGG TTTGGCCGAT GCTGGTGCAG 
GGGGTGGCGA TGAGCACCTT CTTCCTGTCG ATGGTGACCA TCTCGCTGAA CGGCGTGTCG 
CCCCAGCAAC TGCCGTCGGC CTCGGGCCTG TCGAACTTCT CGCGGATCAC CGCGGGCAGC 
TTCGCGGCCT CGCTGACCAC GACGATCTGG GACCGGGGCG AAAGCCTGCA CCAGAACCGC 
ATCGCCGAAT CCATGGCCTC GAACGACCCG GCCTGGCTGG CGGCCGTGGA CCACATGCAG 
GCCGCGGGCC TGAGCCACGC CCAGGCCGTG GGCGCGGTGA CCGCCCAGGT CGTCAACCAG 
GCTTACCTCC TGTCGACCCT CGACTTCTTC CGCGCTTCGG CTTGGCTGGC GGTCCTGCTG 
ATCCCATGCA TCTGGCTGAC CAAGAAGGCG ATGAGCGGCG GCGGCGCGCA CGCGGCGGCC 
GACTAG

Protein sequence

MADQDSSPAA ASGPAPLTGM MLAVTSIALA LGTFMQVLDS TIANVSIPTI AGNLGVSTSQ 
GTWVITSFAV ANGVSVPLTG WLMGRYGVVK TFVVSVLLFT LASFLCGVSW NLPSLIGFRI 
LQGLVSGPMI PGSQALLIMI FPASRRGTAL AIWSMTTLVA PICGPILGGY ISDNIAWEWI 
FLINVPVGLL CAFLCWRGMN NRETPTRKVP IDTTGFMLLL VWVGALQVML DTGKDADWFN 
SPAIVVETLV AIVGFIAWVI WELNEKHPIV DLSLFKSKNF ALGTVAFCLG YAVFFGSNLL 
QPLWLQTQMH YIATWAGLVA APSGVVAVLL TPFAARIMQK VDARWTATLS LAAFALSFYM 
RSGFTPDVDF KALVWPMLVQ GVAMSTFFLS MVTISLNGVS PQQLPSASGL SNFSRITAGS 
FAASLTTTIW DRGESLHQNR IAESMASNDP AWLAAVDHMQ AAGLSHAQAV GAVTAQVVNQ 
AYLLSTLDFF RASAWLAVLL IPCIWLTKKA MSGGGAHAAA D