Gene Caul_2951 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2951
Symbol
ID	5900406
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3201864
End bp	3203597
Gene Length	1734 bp
Protein Length	577 aa
Translation table	11
GC content	72%
IMG OID	641563448
Product	AMP-dependent synthetase and ligase
Protein accession	YP_001684576
Protein GI	167646913
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.982174
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCCGC CGGGCCAGGA CACGCAACCG CCGGCCACCT TGGTCGCGGG CATGCTGGCG 
GCCGCCGCCG CCTATCCGGA GAACGGTTTC ACCTTCCAGG ACGCGGCGGG CCGCGAGACC 
TTCTACAGCT TCCCCGACCT GCTGCTGGCC ACCGAGCGCG CCGCCGCGGG CCTGCAAAGC 
CTGGGCCTGG GCCACGGCGA CCGGATCGCC CTGCTGACCC AGGATCCCGA GGAGTTCATC 
ATCGCGTTCC TCGGGGCGGT GCGGGCCGGG ATCGCGCCCG CCCCGCTCTA TCCGCCGCCG 
CCGCTGGGCG GCATAGAGAT CTATCTGAGC CAGACCGTCG CCCTGCTCGA TGTGGCGCGC 
CCCGCCGCCC TGATCGGCTC GGCCAAGGTG CTGGGCGACA TCCAGGCCGC CGTCGCCGGC 
CTGGACGGCG TCAAGGCCGT CGCCACCGTG CAGGAGATCC GCGCCTGCCA GGCGCCGATG 
ACGCCCTGCG AGGTCGGCCC GGACGACGTG GTCTTCCTGC AGTTCACCTC GGGCTCGACC 
AGCACGCCGC GCGGCGTGAT CGTCACCCAC CGCGCCCTGG TCGCCAATAT CGCCTGCTTC 
ATGGACCAGT CGCTGCAAGC CGATCCGGCC CGCGACAAGG GCGTCACCTG GCTGCCGCTC 
TATCACGACA TGGGGCTGAT CGGCTTCGTG CTGGGACCCG TCCATACTGG CGTCTCGGTG 
GTGTTCATGC CGACCGTGCG GTTCGCCAAG TCGCCGGCCG CCTGGCTGGA CGCCCTGCAC 
CAGCATCGCG GCACCATCAC CTTCGCCCCC AACTTCGCCT TCGCCCTGCT GCTGCGCCGG 
CTGCGGGCCG AGGATCTGGG GCGCTGGGAC CTGTCCTGCG TCAAGGCCCT GGGCTGCGGG 
GCCGAGCCGA TCCACCCCGA CCTGATCGAG CGCTTCCTCG ACGTCTTCGC CGCCGCCGGG 
CTGAGCCGCG ACGCCTTCCT GCCCGCCTAC GGCCTGGCCG AGGCCACCCT GGCCGTGGCC 
CTGCGCCGGC TGGGCGCGCC GGTCAGCACC CAGCGGGTTG ACCGCGAGAC CTTCGAGCGC 
ACCGGCGTCT CCACGCCCGC GCGGGAAGAC CGTTCCTGGC TCGATCATGT CGGGTTCGGC 
GGCCCCTTCG CGGGACATGA AATCGCTATC CGCGACCCCG ACGGCGCGGC CCTGCCCCAT 
GGCCGCGAAG GCGACATCTG GCTGCACGGC CCCTCGGTCT GCGCCGGCTA TCTGGGCGAC 
GAGGCCGGCT GGAACGCTAT CTGCCGGGAC GGGTGGCTCA ACACCGGCGA CCGGGGCTAT 
CTGGCGGACG GCGAGCTGTT CGTGTCCGGA CGGTCCAAGG AACTGATCAT CGTCAACGGC 
CGCAACATCC ATCCCCAGCC GTTGGAATGG GCGGTCAGCG CGCTGTCGGG CGTGCGGCCT 
CAATGCGTCG CGGCCTTCGC CGTGCCGTCC CTGACCACCG AGGCCATCGT CATCGCCCTG 
GAAGCCAAGG GCCGGCCGAC GACCGATCTG GTGGCCGCCG TCGAGGACGC GGTCGAGGAC 
CTGGTCGCCT GCCGGCCGCT CGACGTCGTC CTGCTGCCGT CCGGCTCGCT GTCGCGCACC 
ACCTCCGGCA AGCTCAAGCG CGGCCACGTG CGGCGGCGGT ATCTGGACGG CGACCTGCCC 
AGATTGGAGC CGACGCCCGT CTCCATGCCC GTTGGGGAGG CAGGCCAACC GTGA

Protein sequence

MNPPGQDTQP PATLVAGMLA AAAAYPENGF TFQDAAGRET FYSFPDLLLA TERAAAGLQS 
LGLGHGDRIA LLTQDPEEFI IAFLGAVRAG IAPAPLYPPP PLGGIEIYLS QTVALLDVAR 
PAALIGSAKV LGDIQAAVAG LDGVKAVATV QEIRACQAPM TPCEVGPDDV VFLQFTSGST 
STPRGVIVTH RALVANIACF MDQSLQADPA RDKGVTWLPL YHDMGLIGFV LGPVHTGVSV 
VFMPTVRFAK SPAAWLDALH QHRGTITFAP NFAFALLLRR LRAEDLGRWD LSCVKALGCG 
AEPIHPDLIE RFLDVFAAAG LSRDAFLPAY GLAEATLAVA LRRLGAPVST QRVDRETFER 
TGVSTPARED RSWLDHVGFG GPFAGHEIAI RDPDGAALPH GREGDIWLHG PSVCAGYLGD 
EAGWNAICRD GWLNTGDRGY LADGELFVSG RSKELIIVNG RNIHPQPLEW AVSALSGVRP 
QCVAAFAVPS LTTEAIVIAL EAKGRPTTDL VAAVEDAVED LVACRPLDVV LLPSGSLSRT 
TSGKLKRGHV RRRYLDGDLP RLEPTPVSMP VGEAGQP