Gene Caul_4655 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4655
Symbol
ID	5902117
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	5031669
End bp	5032796
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	67%
IMG OID	641565174
Product	hemolysin-type calcium-binding region
Protein accession	YP_001686273
Protein GI	167648610
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2931] RTX toxins and related Ca2+-binding proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCTA CATTCCTGAC ACTGACCGAG AACGAGAGCT ATGTGATCGG TGCGCCCGAC 
ACGAAGTTTC CCTTCGTGGT CGTCGGTGTG GGCGGCGGCG GCGTTGTCAC CACGCCCAAT 
CCCAACCCCG AACCTCGTGA GGCCTTCTTC AAGTACGAGT ATCAGGCGGG CGGCAAGGGC 
TTTGGCCACT TCGTGGTCAA CAACCCCTAT TTCGGCGAAT ATTCGCCGGT CTTCGTGACC 
ATCCTCGGCG CGGACGGCTC GGCGCCGGTC CAGCATGCGC CGACAGCCCA GGGCGAAACA 
CTGACGCTGG CGAACGCCAA CAGCGGCTTC AACCTGTCCC GGTTGCTGGC CAACGATGTC 
GATCCGGACG GCGACCTACT GTACGTCCAC ATCGTCTCGC CGTTCTCGTT CACCGCGCCG 
GCGGGCTCGA CCACGTCCGC CGAGGTCTTC AGTCATTCAC CGGATCTGCC ATTCAACACG 
GTGTTTCCGC TCGACGGCAG CCAGCTGTCC ATCGCCGCTG ACAAGCCCGA CGGCACGCCC 
CTGGGCTATA CCGAACTGCG GTTCGACTAT TTCGTCAGCG ACGCCTATGG CAACGCCTCC 
AATACGGTCC AGGCCGTGAT CAAGATCGGC GCGCCGCCGG CGGGCGCCTA TGTCGCGGGC 
GGGGCCGGTG ACGACACCAT CGACAAGAGC GGCACGACCG TCGCCTGGCA ATTGGCCGGC 
GGGGGCGGCG ACGACTATCT GTGCGGCGGC TCGGGCAATG ACAGCCTGAA CGGCGGGGCG 
GGCGACGATC GGCTGATCGG CGGCGCGGGC AACGACGTCC TCACGGGCGG GACGGGCGCC 
GACCGCATGT TCGGCGGCGC GGGCAATGAC ACGTTCCTGA TCCGGGCGGG AGACCTGGCG 
ACCGGGCCGG TCAAGGACCA GATCATCGAC TTCGAGGGCG CCGGCGTGAC CGGTGGCGAC 
ATGCTGCGGC TCGTCGGCTT CGGCGCCGGC GCCACCCTGG TGCATCTGGG CGAGGTCGGC 
GCGGTTTCCC ACTACATGAT CAACGACGGC GCGCACTCCG GCGAGTTGTG GGTGCAGGCG 
GGCGGCGTCC TGCTGCAACC GGGCGACTAC GGCTTCGTCT CCGCCTAG

Protein sequence

MAATFLTLTE NESYVIGAPD TKFPFVVVGV GGGGVVTTPN PNPEPREAFF KYEYQAGGKG 
FGHFVVNNPY FGEYSPVFVT ILGADGSAPV QHAPTAQGET LTLANANSGF NLSRLLANDV 
DPDGDLLYVH IVSPFSFTAP AGSTTSAEVF SHSPDLPFNT VFPLDGSQLS IAADKPDGTP 
LGYTELRFDY FVSDAYGNAS NTVQAVIKIG APPAGAYVAG GAGDDTIDKS GTTVAWQLAG 
GGGDDYLCGG SGNDSLNGGA GDDRLIGGAG NDVLTGGTGA DRMFGGAGND TFLIRAGDLA 
TGPVKDQIID FEGAGVTGGD MLRLVGFGAG ATLVHLGEVG AVSHYMINDG AHSGELWVQA 
GGVLLQPGDY GFVSA