Gene Caul_1786 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1786
Symbol
ID	5899241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1887943
End bp	1889016
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	67%
IMG OID	641562276
Product	arsenical-resistance protein
Protein accession	YP_001683413
Protein GI	167645750
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0258081
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCATCT TCGAACGCTA CCTGACCCTG TGGGTGGCGC TGTGCATCGT CGTCGGCGTG 
GCGCTGGGGC ATTTCTTCTC GCCGGCCTTT CATGCCGTCG CCGCCCTGGA GGTCGCCAAG 
GTCAACCTGC CGATGGCCGG CCTGATCTGG CTGATGATCA TCCCGATGCT CATCAAGGTC 
GATTTCGCGG CCCTGGGCGA GGTGCGCAAC CACTGGCGCG GCATCGGCGT GACGCTGTTC 
ATCAACTGGG TGGTCAAGCC GTTCGGCATG GCGCTCCTGG GCTGGATCTT CATCGCCCAC 
CTGTTTCGCC CCTGGCTGCC GGCCGAGCAG GTCGAAAGCT ATATCGCCGG CCTGATCCTG 
CTGGCGGCGG CGCCCTGTAC GGCGATGGTG TTCGTCTGGA GCAACCTGAC CGACGGCGAG 
CCCAACTTCA CCCTCAGCCA GGTGGCGCTG AACGATACGA TCATGGTCGT GGCCTTCGCC 
CCGATCGTCG GCCTGCTGCT GGGCCTGTCG GCGATCACCG TGCCGTGGTC GACCCTGACC 
CTGTCGGTGG GGCTCTATAT CCTCGTTCCG GTCCTGGCGG CGCAAGTGAT CCGCCGGGTC 
CTGCTGGCGC GCGGTCCGCA GGCGCTGGCC AGCGTCCTGG CCAGGCTGCA GCCGCTGTCG 
ATCGCGGCGC TGCTGGCGAC GTTGGTCCTG CTGTTCGGCT TCCAGGGCGA CCAGATCCTG 
AAGCAGCCGC TGATCATCGC GATCCTCGCC GCGCCGATCC TGATCCAGGT CTATTTCAAC 
GCCGGCCTGG CCTACATCCT CAATCGGATC ACCGGCGAAG CCCACTGCGT GGCTGGCCCT 
TCGGCCCTGA TCGGGGCCAG CAACTTCTTC GAGCTGGCGG TGGCCGCCGC CATCAGCATC 
TTCGGATTCC AATCCGGCGC GGCCCTGGCC ACCGTGGTCG GGGTGTTGAT CGAGGTGCCG 
GTCATGTTGT CGATCGTCGC CATCGTGAAC GCCAGCAAGG CCTGGTACGA ACGCGGCGGC 
GCCGTCCGCG CCGTGGCCGC CCGCCGCAAG ACCCTCTCTT CAAAGCCCCG GTGA

Protein sequence

MSIFERYLTL WVALCIVVGV ALGHFFSPAF HAVAALEVAK VNLPMAGLIW LMIIPMLIKV 
DFAALGEVRN HWRGIGVTLF INWVVKPFGM ALLGWIFIAH LFRPWLPAEQ VESYIAGLIL 
LAAAPCTAMV FVWSNLTDGE PNFTLSQVAL NDTIMVVAFA PIVGLLLGLS AITVPWSTLT 
LSVGLYILVP VLAAQVIRRV LLARGPQALA SVLARLQPLS IAALLATLVL LFGFQGDQIL 
KQPLIIAILA APILIQVYFN AGLAYILNRI TGEAHCVAGP SALIGASNFF ELAVAAAISI 
FGFQSGAALA TVVGVLIEVP VMLSIVAIVN ASKAWYERGG AVRAVAARRK TLSSKPR