Gene Caul_3975 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3975
Symbol
ID	5901437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4305420
End bp	4307012
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	70%
IMG OID	641564496
Product	long-chain-fatty-acid--CoA ligase
Protein accession	YP_001685598
Protein GI	167647935
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.251646
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.301159
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGCAG CCGCCGTCGA TTTCGATCGC ATGACGACGT TGGGCGACGT CGCCCGCTAC 
CACCGGCAGG TCCGGCCCGA AGCCACGGCC CTGGTGTTCG AGGGGCGGGC GACCAGCTTC 
GCGGACTTCG ACCGCAACAC CGACAGGGTG GCCGCCGCCC TGCTGGCCGA GGGCCTGACC 
AAGGGCGACC GCATCGCCTA TGTCGGCAAG AACAGCGACC ACTATTTCGA GCTGCTGTTC 
GGCGCCGCCA AGGCCGGGGT GGTGCTGGCC CCGATCGGCT GGCGCCTGGC CCCGCGCGAG 
ATCGCCTACA TCCTGGGCGA CGCCGAGGCG CGCATGGTGT TCGTCGGTCC GGAAATGATC 
GCCCACGTCC GTGACGTGGC CGAATTGATC CTGGACCAGC CGACGCTGGT CGCCATGGAG 
CCCAACGACT ACGGCCACCC GGAATTCATG CCCTGGCGCG ACGCCGCGCC CGAGGATGGC 
AAGCCCGCCC ACGTAACCTC GGCCGACATC GCCGTCCAAC TGTACACCTC GGGCACCACC 
GGCCGGCCCA AGGGCGCGAT GCTGACCCAC GCCAACATCC TGGGGCCGCG CAGGCTGGCC 
GCCGCCGCCG ACATGGCCTG GAACCGCTGG GGGCCGGACG ATGTCAGCCT GGTGGCCATG 
CCCGTGGCCC ATATCGGCGG CACCGGCTGG GGCGTGGTCG GGCTGGTCAA CGGCGCCAAG 
GGCGTGGTGG CCCGCGAGTT CGACCCGACC AAGGTGCTGG ACTTCATCGA GCGCGACCGG 
GTCTCCAAGA TGTTCATGGT GCCCGCCGCC CTGCAGATCG TCGTGCGCCT GCCGCGCGCT 
CGCCAGGTCG ACTACAGCCG CCTGACCCAC ATCCTCTACG GCGCGGCCCC CATTCCGCTG 
GACCTGCTGC GCGAGTGTCT CGAGGTGTTC GGCTGCGGCT TCGTCCAGCA GTACGGCATG 
ACCGAGACGA CCGGCACGGT GGTCTATCTG CCGCCCGAGG ACCACGACCC GGCCGGCAAC 
CCCCGCATGC GCTCGGCCGG CCTGCCCATG CCCGGCGTCG AGCTGAGGAT TCTCGGCGAG 
GACGGCCGGG TCCTGCCGCC GGGCGAGGTC GGCGAGGTGG CGGTCCGCTC GCCCGCCAAC 
ATGGCCGGCT ACTGGAAGCT GCCCGAGGCG ACGGCCGACA CTATCGATTC CGATAGCTGG 
TTGCGCACCG GCGACGCCGG CTACATCGAC GCGGACGGCT ACCTGTTCAT CCACGATCGC 
GTGAAGGACA TGATCATCAG CGGCGGCGAG AACATCTATC CGGCCGAGGT GGAGAGCGCC 
GTCTATGGCC ACCCGCACGT GGCCGAGGTG GCGGTGATCG GGGTGCCCGA CGACACCTGG 
GGCGAGGCGG TCAAGGCGGT GGTCGCCCTC AAGCCCGGCG CGCCGCGCGA TCCGGCCGAC 
ATCATCGCCT TCTCCCGCAC CCGCATCGCC GGCTTCAAGG CCCCCAAGAC CATCGACTTC 
GTCGAGGCTT TGCCGCGCAA CGCCTCGGGC AAGATCCTGC GCCGCGAGCT GCGCGAGCCC 
TACTGGGCGG GCAAGACGCG ACGGGTGAAC TAG

Protein sequence

MSAAAVDFDR MTTLGDVARY HRQVRPEATA LVFEGRATSF ADFDRNTDRV AAALLAEGLT 
KGDRIAYVGK NSDHYFELLF GAAKAGVVLA PIGWRLAPRE IAYILGDAEA RMVFVGPEMI 
AHVRDVAELI LDQPTLVAME PNDYGHPEFM PWRDAAPEDG KPAHVTSADI AVQLYTSGTT 
GRPKGAMLTH ANILGPRRLA AAADMAWNRW GPDDVSLVAM PVAHIGGTGW GVVGLVNGAK 
GVVAREFDPT KVLDFIERDR VSKMFMVPAA LQIVVRLPRA RQVDYSRLTH ILYGAAPIPL 
DLLRECLEVF GCGFVQQYGM TETTGTVVYL PPEDHDPAGN PRMRSAGLPM PGVELRILGE 
DGRVLPPGEV GEVAVRSPAN MAGYWKLPEA TADTIDSDSW LRTGDAGYID ADGYLFIHDR 
VKDMIISGGE NIYPAEVESA VYGHPHVAEV AVIGVPDDTW GEAVKAVVAL KPGAPRDPAD 
IIAFSRTRIA GFKAPKTIDF VEALPRNASG KILRRELREP YWAGKTRRVN