Gene Caul_0450 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0450
Symbol
ID	5897907
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	494265
End bp	495455
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	66%
IMG OID	641560936
Product	lipid-transfer protein
Protein accession	YP_001682085
Protein GI	167644422
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.607099
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTAAAGC AGGATCGCGA TGCGTTGGTG GCCGGTGTCG GCATGGTGGC TTTCACCAAG 
CCCAGCGCCA ATCTCGCCTA TGACGACTTC GCAAGCGAGG CGGTAAAGCT GGCGTTGGCG 
GACGCGGGGG TCGACTACAA CTTGGTGCAG CAGGCCTATG CTGGTTTTGT CTTCGCCGAC 
AGCTGCGCGG GACAGCGCGT GATCTATCGA GCTGGCATGA CCGGCATCCC GATCATCAAC 
GTCAACAACA ACTGCGCCAC CGGCTCCACC GCCCTTTTTC TGGCCCGGCA GGCCGTCGCG 
TCCGGCGCCG TCGACTGCGC GCTGGCGGTG GGTTTCGAGC AGATGTCGCC GGGCGCCTTG 
GGCAGCGCCT ATCCCGATCG GGTCAGTCCG TTCGCCGACT TTGACGTCAC TTGCGAGGGA 
CTCGTCGATG TCGAGCTGCC GCTTGCGCTC AAATACTTTG GCGGCGCGGG CCGAGAGCAT 
ATGGAGCGCT ATGGCACCAC TCTGGAAAGT TTCGCCATGG TGCGGGCCAA GGCGAGCCGG 
CACGCCGCCA AGAACCCCCT TTCGGTCTTT CGCAATGTCA TGAGCGTGGA GGAGGTCCTG 
GCCGCGCCAA TGATGTGGCC CGGCGTCATG ACCCGCCCCA TGGCCTGCCC GCCAACCTGC 
GGCGGCGCCG CCGCCGTGAT CGTCTCACCC GATTTTGCGC GCCGCCACGG GCTTTCGGCC 
AAGGTCCGGA TCGCGGCCCA GGCCATGACC ACCGACACTC CATCGACCTT CGATGACCAA 
AGCATGATCT CCCTGGTTGG CGCCAAGATC GCCAAGGCTG CCGCTCAGGC CGTCTACGAG 
GCCGCGAGCG TGGATCCGCG CGACATCCGG GTCGTCGAGC TGCACGACTG CTTCGCCCAT 
AATGAAGTGC TGTCCTACGA GGCCCTGGGC CTGTGTCCCG AGGGCGGGGC AGGCGGCTTC 
ATCGCCGACG GCGACAACAC CTATGGCGGG CGGGTCGTGA CCAATCCGTC CGGGGGGCTG 
CTGTCCAAGG GCCATCCGCT CGGCGCGACA GGCCTGGCGC AATGCTACGA GCTCACCTTG 
CAGCTTCGCG GAACCGCGGG CGAGCGCCAG GTCGAGGGCG CGCGGCATGG ACTGCAGCAT 
AACCTTGGCT TGGGCGGGGC CTGCGTCGTC ACCCTCTATG AAGCCGTCTA G

Protein sequence

MVKQDRDALV AGVGMVAFTK PSANLAYDDF ASEAVKLALA DAGVDYNLVQ QAYAGFVFAD 
SCAGQRVIYR AGMTGIPIIN VNNNCATGST ALFLARQAVA SGAVDCALAV GFEQMSPGAL 
GSAYPDRVSP FADFDVTCEG LVDVELPLAL KYFGGAGREH MERYGTTLES FAMVRAKASR 
HAAKNPLSVF RNVMSVEEVL AAPMMWPGVM TRPMACPPTC GGAAAVIVSP DFARRHGLSA 
KVRIAAQAMT TDTPSTFDDQ SMISLVGAKI AKAAAQAVYE AASVDPRDIR VVELHDCFAH 
NEVLSYEALG LCPEGGAGGF IADGDNTYGG RVVTNPSGGL LSKGHPLGAT GLAQCYELTL 
QLRGTAGERQ VEGARHGLQH NLGLGGACVV TLYEAV