Gene Caul_4668 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4668
Symbol
ID	5902130
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	5046917
End bp	5048701
Gene Length	1785 bp
Protein Length	594 aa
Translation table	11
GC content	71%
IMG OID	641565187
Product	sodium/hydrogen exchanger
Protein accession	YP_001686286
Protein GI	167648623
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0475] Kef-type K+ transport systems, membrane components
TIGRFAM ID	[TIGR00932] transporter, monovalent cation:proton antiporter-2 (CPA2) family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0852287
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAGCACG CGATAACGCC GGCGGACTAC AAGGACCTGG TGCTGTTCCT GGCCACGGCG 
GGCATCGTCG CGCCGCTGTT CAAGCGGCTG AAGCTGAACC CCATCCTGGG CTTTCTCATC 
GCCGGCGTGA TCCTGGGGCC GTTCGGCCTG GGCGCGCTCA GCCACCGGCT GCCGTGGCTG 
GACTACGTCA CGGTCGACAG CCCCGAGGAA ATCGCCCAAC TGGCCGAGTT CGGGGTGGTG 
TTCCTGCTGT TCATGATCGG CCTGGAGCTG TCATGGGAGC GCCTGCGGCT GCTGCGCAAG 
CTGGTGTTCG GCCTGGGTGC CCTGCAGATG ATCGGCTGTT CGCTGGCGCT GGGCGCGGTG 
GCCTGGCTGC TGGGCCAGAC CCCGGTCGCG GCCCTGACCA TCGGCGCGGC CCTGACCCTG 
TCGTCCACCG CCATCGCCGT GCCGGTGCTG GTCGAGCGGA AGCGCCTGCA TTCCGAGGGC 
GGACGGGCGA CCTTCTCGGT GCTGCTGTTC CAGGACCTGG CCGTGGCCCC GATCCTGATC 
ACCCTGGCGG TGCTGGGGCG GGCCGACGGC GCGTTCCGCC TGACCGACTT GCTGGCCCTG 
GGCCCGGCGG CCGTCGGCCT GGGCGTCATC GTGCTGTTTG GCCGCCTGGC GCTGCGGCCG 
ATGATGCGCT CGGTCGCGAA AGCCAAGAGC GAAGAAATGT TCATGGCCGC CTGCCTGCTG 
GTGATCATCG GGGCGGGCCT GGTGGCCGCC CTGTCGGGTC TGTCGATGGC CCTGGGCGCC 
TTCGTGGCCG GGGTGCTGCT GGCCGAAACC GAGTACCGCC ACGAGGTCGA GGTCAAGATC 
GAGCCGTTCA AGGGCCTGCT GCTCAGCCTG TTCTTCGTCT CGCTGGGCAT TCGCCTGGAC 
CTGTCGCTGC TGGTCGCCTC GCCGGGTCTG GTGCTGGGCG TCGCCGTCGG GCTGCTGGCG 
ATCAAGGGCG TGATGATCAC GGGGCTGGGC CGGCTGTTTG GCCTGTCGAA CCGCGCGGCC 
ATCGAGGCGG CCCTGACCCT GGCGGCGGGC GGCGAGTTCG CCTTCGTGAT CCTCGACAAC 
GCCATGGGCG CCGGCGTGGT TCAGGCCCGG ATCGGCCAGG CGGTGCTGGT GGCCGCCACA 
CTGACCATGT TCCTGATCCC GCTGCTGTCG GGGATCGGCG GACGCCTGGC CAAGAAGACC 
GCCGCCCCGG TCAGCGAGGC GCCCGATCTG GTGGGCCTGC AGAGCGAGGA GCCGGCGGGC 
CGCGTGCTGG TGGTCGGTTA CGGCCGCGTC GGCCGGCTGG TCGGCGACAT GCTCGACCGC 
CACGAGCTGC CGTGGATCGC CATCGATCGC GACCCCGGCT TCGTCCAGCA GGGCCGCCGG 
GCCGGCCACC GGGTCTACTA CGGCGACGCC TCGCGGGTGG AGCTGCTGGA GCGCTGCGGC 
CTGGACCACG CCCGCGCGGT GGTGGTGACC ATGGACTCGC CGGAAGCCGC CGAGGCGGTG 
GTGGCCACCG CCCGCGGCCA TCGTCCCGAC CTGACCATCG TCGCCCGGGC CCGCGACGCC 
CGCCACGCCG CCCGGCTCTA CGAACTGGGC GCCACCGACG CCGTGCCGGA GACCATCGAG 
GCCAGCCTGC AGTTGTCTGA AGCCGTGCTG GTCGACATCG GCGTGCCCAT GGGCCTGGTC 
ATCGCCTCGA TCCATGAACG CCGCGACGAG TACCGCAAGG TGCTGAACCG CCCGGACGCC 
CTGGGCGGGC GGCGCAAGAG ATTGAGGGAT GCGGGTAGGG TTTAG

Protein sequence

MEHAITPADY KDLVLFLATA GIVAPLFKRL KLNPILGFLI AGVILGPFGL GALSHRLPWL 
DYVTVDSPEE IAQLAEFGVV FLLFMIGLEL SWERLRLLRK LVFGLGALQM IGCSLALGAV 
AWLLGQTPVA ALTIGAALTL SSTAIAVPVL VERKRLHSEG GRATFSVLLF QDLAVAPILI 
TLAVLGRADG AFRLTDLLAL GPAAVGLGVI VLFGRLALRP MMRSVAKAKS EEMFMAACLL 
VIIGAGLVAA LSGLSMALGA FVAGVLLAET EYRHEVEVKI EPFKGLLLSL FFVSLGIRLD 
LSLLVASPGL VLGVAVGLLA IKGVMITGLG RLFGLSNRAA IEAALTLAAG GEFAFVILDN 
AMGAGVVQAR IGQAVLVAAT LTMFLIPLLS GIGGRLAKKT AAPVSEAPDL VGLQSEEPAG 
RVLVVGYGRV GRLVGDMLDR HELPWIAIDR DPGFVQQGRR AGHRVYYGDA SRVELLERCG 
LDHARAVVVT MDSPEAAEAV VATARGHRPD LTIVARARDA RHAARLYELG ATDAVPETIE 
ASLQLSEAVL VDIGVPMGLV IASIHERRDE YRKVLNRPDA LGGRRKRLRD AGRV