Gene Caul_0212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0212
Symbol
ID	5897486
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	226196
End bp	227815
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	69%
IMG OID	641560696
Product	AMP-dependent synthetase and ligase
Protein accession	YP_001681847
Protein GI	167644184
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.240297
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCTGG GCCTGATGCA GACCACGCCC TTGCTGGTCA GCGGCATCCT GCGCTACGCG 
GCCGCCGCCC ACGGCGGACG CGAGATCGTG TCGCGGCTGA TCGACGAGCC CGTCTGGCGC 
TACGACTATG CCGGCCTGTC GCGCCGTTCG GCCCAGGCGG CCAACGCCCT GGCGCGGCTG 
GGCGTGACCT CCGGCGACAG GGTCACGTCC CTGGCCTGGA ACACGCACCG GCACCTGGAG 
CTGTTCTACG CGGTCCCTGG CCTGGGCGCG GTGCTGCACA CCGCCAATCC CCGGCTGTCG 
GACGAGCAGA TCGTCTTCAC GATCAACCAC GCGGCCAGCG GCGTCCTGCT GTTCGATCGC 
AATTTCGCCG AGCTGGTCGC CCGCCTCGCG CCGCGCCTGA CCACGGTGAA GACCTTCGTG 
ATGCTGTCGG ACGCCGAGCG AACCCATGAC GCCGGCGTCA GGGCGAGGTC GTACGAGACC 
CTGATCGCCG GTGAGGCCGA GACCTTCGAC TGGCCCAGCT TCGACGAGAA CGCCGGGGCC 
TTCCTCTGCT ACACCTCGGG CACGACGGGC GATCCCAAGG GGGTGCTCTA TTCGCACCGC 
GCCGTGGTGC TGCACGCCAT GGCCGGCGGT CTGGCCAGCG CCTTTGGCCT GACGGCCTTC 
GACGTGGTGA TGCCGTGCTC CAGCCTCTAC CACGCCACGG CCTGGGGCCT GCCGTTCACC 
GCCCCGATCT GCGGCTCCAA GCTGGTCCTG CCCGCCGACA AGATGGATGG GGCCTCACTA 
CACCAGCTGA TCCAGGACGA GGGCGTCACC TTCACCGGCG GTGTGCCGAC CATCTGGACG 
ATGTATCTCT CCTGGCTGGA GCAGACCGGC CAGCGGCCGG ACACTCTACG CAGGGTCGTG 
ATCGGCGGCA GCGCCGTGCC CCGCGCCATG GCCGCGACCT TCAAGACGAA GTATGGCGTC 
GACGTACTGC AGATCTGGGG CATGACCGAG ACCTGCCCGA TCGGCGTGGT CGCCACCCCG 
ACCCCATCCC TGGCCGCCCT GGGCGACGAG GCGATGAGCG ACGCCATCTG GACCCGCCAG 
GGACGGCTGC AATTCGGCAT CGAGCTGAAG GTCGAGAACG AGGACGGCTC GGAGGCCCCG 
CGCGACGGCG AGACGTCCGG AGCCCTGAAG GTGCGCGGAC CCTGGGTGGT GCGGCGCTAC 
TACCGCCAGG AGGCCGACGT CGCCGACGCC GACGGCTGGT TCGACACCGG CGACATCGCC 
ACCCTCGACG AACACGGCTT CATGCGGATC ACCGATCGCC AGAAGGATGT GATCAAGTCG 
GGCGGCGAGT GGATCAGCTC GATCGATCTG GAGAACATCG CCGCCGGCTG CCCGGGCGTG 
AAGATCGCCG CCGTGGTCGG CGTGCCCCAC CCGAAGTGGG AGGAGCGGCC GCTGCTGGTC 
ATCGAGGTCC ACGAGGGCTC GGTGGTCTGC AAGGCGGAGG TGCTCGCCTA CCTGGGATCG 
CGGATCGTCA AGTGGTGGAC GCCCGACGAC GTAGTGTTCG CGGCGGTGCC GCTGACGGCG 
ACGGGCAAGA TCGACAAGAA GGTGCTGCGC GAGGTATGGC GGGGGCATTT GATGGGGTAG

Protein sequence

MILGLMQTTP LLVSGILRYA AAAHGGREIV SRLIDEPVWR YDYAGLSRRS AQAANALARL 
GVTSGDRVTS LAWNTHRHLE LFYAVPGLGA VLHTANPRLS DEQIVFTINH AASGVLLFDR 
NFAELVARLA PRLTTVKTFV MLSDAERTHD AGVRARSYET LIAGEAETFD WPSFDENAGA 
FLCYTSGTTG DPKGVLYSHR AVVLHAMAGG LASAFGLTAF DVVMPCSSLY HATAWGLPFT 
APICGSKLVL PADKMDGASL HQLIQDEGVT FTGGVPTIWT MYLSWLEQTG QRPDTLRRVV 
IGGSAVPRAM AATFKTKYGV DVLQIWGMTE TCPIGVVATP TPSLAALGDE AMSDAIWTRQ 
GRLQFGIELK VENEDGSEAP RDGETSGALK VRGPWVVRRY YRQEADVADA DGWFDTGDIA 
TLDEHGFMRI TDRQKDVIKS GGEWISSIDL ENIAAGCPGV KIAAVVGVPH PKWEERPLLV 
IEVHEGSVVC KAEVLAYLGS RIVKWWTPDD VVFAAVPLTA TGKIDKKVLR EVWRGHLMG