Gene Caul_4540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4540
Symbol
ID	5902001
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	4913767
End bp	4914807
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	69%
IMG OID	641565059
Product	cation diffusion facilitator family transporter
Protein accession	YP_001686158
Protein GI	167648495
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1230] Co/Zn/Cd efflux system component
TIGRFAM ID	[TIGR01297] cation diffusion facilitator family transporter

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.115451
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAACG ATCACGATCA CAAGCACGAT CATTCCGACC ATGATCACCA CGATCATGGC 
CATGACGACC ACCATGATCA CGATCATGGC CACGGCCACT CGCATGACCA CGGCCACCAT 
CACCACGGCC CCGGTGGGCA CAGTCATGCG CCCAAGGATT TCGGCCGCGC CTTCGCGGTC 
GGCGCGACGC TGAACATCGG CTTCGTCATC GCCGAGACCG TCGCCGGCCT GATGACCCAT 
TCGCTGGCCC TGCTGGCCGA CGCCGGCCAC AACCTGTCGG ACGTGCTGGG GTTGTTCATG 
GCCTGGGGCG CGGTGGTCCT GGCCAAGCGG GCGCCGGCCG GCCGCCATAC CTATGGCCTG 
CGCAAGGGCA CGATCCTGGC CTCACTGACC AACGCCGTCT TCCTGCTGGT CGCGGTCGGC 
GCCATCGCCT GGGAGGCCGC CCGCCGCTTC GCCGATCCGC ACCCGATCGA CACCGGGCCG 
GTGATGATCG TCGCGGCGAT CGGCATCGTC ATCAACACCG CCACGGCCCT GATGTTCATG 
CGCGGCTCGA AGGACGACCT CAATATCCGC GGCGCCTTCC TGCACATGGC CGCCGACGCC 
GCCGTCTCGG CGGGGGTCGT GGTCGCCGCC CTGGTCATGT GGCGCACCGG TTGGTTGTGG 
CTGGACCCGG TGGTCAGCCT GGGCATCGTG CTGGTGATCG TGCTGGGCAC CTGGAGCCTG 
CTGCGCGACA GCCTGGACCT GGCCCTGGAC GCCGCCCCGC GCGGCATCGA CCCCATGGCG 
GTAAAGGACT GGCTGACCGC TCGCCCCGGC GTCAGCGAGG TCCACGACCT GCACATCTGG 
GCGATGAGCA CCACCGAAAC GGCCATGACC GCCCACCTGG TGCGGCCCCT CGGGGCCGGC 
ATGGTCGGCG AGGACCTCGA CGCCTTCCTG CACGACGCCT GCGCCGAACT GAACAGTCGG 
TTCAAGATCG GCCACGTCAC CCTGCAGGTC GAGCACAGCG GCGCGGCGTC CTGCCGGCTG 
GCCCCCGCGG ACGTGGTGTG A

Protein sequence

MPNDHDHKHD HSDHDHHDHG HDDHHDHDHG HGHSHDHGHH HHGPGGHSHA PKDFGRAFAV 
GATLNIGFVI AETVAGLMTH SLALLADAGH NLSDVLGLFM AWGAVVLAKR APAGRHTYGL 
RKGTILASLT NAVFLLVAVG AIAWEAARRF ADPHPIDTGP VMIVAAIGIV INTATALMFM 
RGSKDDLNIR GAFLHMAADA AVSAGVVVAA LVMWRTGWLW LDPVVSLGIV LVIVLGTWSL 
LRDSLDLALD AAPRGIDPMA VKDWLTARPG VSEVHDLHIW AMSTTETAMT AHLVRPLGAG 
MVGEDLDAFL HDACAELNSR FKIGHVTLQV EHSGAASCRL APADVV