Gene Caul_2411 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2411
Symbol
ID	5899866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2631861
End bp	2632967
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	65%
IMG OID	641562902
Product	putative esterase
Protein accession	YP_001684036
Protein GI	167646373
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2382] Enterochelin esterase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.000101635
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.384259
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAATTC TCGACACCTA CGGCGCACGC CTGCGCAGCC CTTGGCCTCG CGCGGGGCTT 
CTTGCGATCA TGGCGCTTCT GGTCGCCGCG CCGGTTGCGG CGCGCGCCCA AGTGACGACG 
AAGGCCCCGC AGCCGGTGGC CGGAGCCAAG CCGGCCCTGA TCCAGAAGAT CAAGGTCCAC 
TCGCTCGCCA TCGAAGGCAA TCTCGAGGGA GAGAGCGCCG ATCGGGACGT CTTCGTGGTG 
CTGCCTCCCG GCTATGCCAG TCACCCCAAG AGACGCTATC CGGTGGTTTA CGCCCTGCAC 
GGCTATTCCA TCGGGGCGGA GCAGTGGATG GGCGAAATCC ACGTCCCCCA GACCATCGAA 
GGCGCCTTCG CCAAGGGCGC GAGCGAAATG ATCATCGTGC TGCCCGACAG CAAGACGGTT 
CACAATGGTT CGATGTATTC CAGTTCGCAG ACCACGGGCG ATTTCGAGAC CTTCATCGCC 
AGGGACCTCG TCGCCTATAT CGACAAACAC TATCGCACCT TGCCCGATCG CGAGAGCCGG 
GGGCTGGTGG GGCATTCGAT GGGCGGCTAT GGCGCCAGCC GCATCGGCAT GCGTCATGCC 
GACGTCTTCG GCGCGCTCTA CATGATGAGC CCCTGCTGCC TGTCGCCGCG CGATCCTGGC 
CAATTCAACG CCGAGGAGGC GTCGACGCTG GCGCAGGTCA AGACGCTCGC CGACGCGCAA 
AAGCTGCCCT GGGGCCTGCG AGCCCAGCTG GCCACCGCGG CGGCCTGGTC GCCCAACCCC 
AACAAGCCGC CGCTCTATCT GGATCTTCCG CTGGACAACG GTCAGGTCCA GCCCGAGGTG 
CTGGCCAAGT GGGCGGCCAA CGCGCCGCTG GCCTTCGTCG ACCAGTACAT CGGCGCCCTG 
CGGCGATACA GGGCCATCGC CATTGATGTC GGCGACCGGG ACGGCTTGAA AGGCGACGCT 
GGCAAGCTGC ATGCGGTTCT GGATCGATAC GGCGTCGCCA ACAGCTTCGA GATCTATCCG 
GGCGACCACA CAAGCGACGT CCCTGGCCGT TTCCAGGAGA ATGTTCTGCC CTTCTTCAGC 
AAGAACCTGA CGTTCCAGGG CCGGTAG

Protein sequence

MTILDTYGAR LRSPWPRAGL LAIMALLVAA PVAARAQVTT KAPQPVAGAK PALIQKIKVH 
SLAIEGNLEG ESADRDVFVV LPPGYASHPK RRYPVVYALH GYSIGAEQWM GEIHVPQTIE 
GAFAKGASEM IIVLPDSKTV HNGSMYSSSQ TTGDFETFIA RDLVAYIDKH YRTLPDRESR 
GLVGHSMGGY GASRIGMRHA DVFGALYMMS PCCLSPRDPG QFNAEEASTL AQVKTLADAQ 
KLPWGLRAQL ATAAAWSPNP NKPPLYLDLP LDNGQVQPEV LAKWAANAPL AFVDQYIGAL 
RRYRAIAIDV GDRDGLKGDA GKLHAVLDRY GVANSFEIYP GDHTSDVPGR FQENVLPFFS 
KNLTFQGR