Gene Caul_3098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3098
Symbol
ID	5900553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3361653
End bp	3362771
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	70%
IMG OID	641563601
Product	acyltransferase 3
Protein accession	YP_001684723
Protein GI	167647060
COG category	[I] Lipid transport and metabolism
COG ID	[COG1835] Predicted acyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCAAA CCGCCTCGAT GTCTCAGAAC GGCTCGCCGG GCCTGTCCCG TGGCGGCGCC 
CTGGATCTCC TGCGGTTCGT CGCGGCGTTG TTCATCGTGC TCTATCATGT GGCCGAGCGG 
GCCCCGGTGT CGCTGTTCGC GATCCACCCG GCCTTCGGGC GCGGCTATCT GGCCACCGAT 
TTCTTCCTGA TGCTGTCGGG CTATGTGCTG GCCAGGACCT ACGGGTCCCG CGTCCTTGAC 
CAGGGCGTCA GGACCGGCGA TTTCCTCAAG CGTCGCCTGC TGCGCATCTG GCCCGCCCAC 
CTGGTGATGC TGGCCCTGTT CGTGGTCTTC GTGCTGGCCA CCGCCGCCAT CGGCCTGGCC 
CCGCAGAACC CGCAATGGTT CCAGTGGAGC CAGCTGCTGC CCCAGGTCTT CCTGATGCAG 
GCCTGGTTCG TGCCCGGCCC GTCGGGCTGG AACATGCCGA CCTGGACACT CTCGGCCCTG 
ATCGTCTGCT ATGGCGGCTT CCCCGCCGCC TGGCGGCTGA CCGCCAAGGT GCGCTCGCCT 
TGGACCACCC TGGCGATCGG CGTCGTGATC TTCCTGGTCG TCGACGCCGC CGCCAAGGCC 
GTCACCGGCA TACCGGCCCA CCAGCTGCCG CTGCGCTTTG GCCTGGTGCG CGGAATCCCG 
CTGTTCATCC TGGGCATGCT GATCGCCCGC CTGCCGACGA CCCTCGCCCC TCGCCTGGCC 
GACGGTCTGG CGATCGCGGC GGGCGTCGGC GTGGTGGCCC TACAGGTCGT CGGCCGGTTC 
GACCACGCCA GCCTGGCCCT GCTGGGCCTG CTGATCTACG CCGCCGGCGC CTCGGGCGCG 
AAGGGCTGGG GCTGGGCCAG CCTGGCCGGC CGGCTGTCGT TCTCGCTGTT CCTCACCAAC 
CAACTGGTCG CCGTGGTCTG GTTCGGCCTG CTGCGCGCGG TCGCCGGCAA GCTGGGCTTC 
GACGACCCCT TGCTGTGGCT GACCTGGGCC ATGGCCCTCC CCGCCTGCGT GATCGCCGCC 
TGGCTGTTCG AGCGCTTCGT CGACGCGCCG CTGCAGGTGT GGATCAAGGG GTGGTCGCGG 
CGCGAGCCGG CGACCAAGGC CGAGCCGGCG CTGGCTTAA

Protein sequence

MSQTASMSQN GSPGLSRGGA LDLLRFVAAL FIVLYHVAER APVSLFAIHP AFGRGYLATD 
FFLMLSGYVL ARTYGSRVLD QGVRTGDFLK RRLLRIWPAH LVMLALFVVF VLATAAIGLA 
PQNPQWFQWS QLLPQVFLMQ AWFVPGPSGW NMPTWTLSAL IVCYGGFPAA WRLTAKVRSP 
WTTLAIGVVI FLVVDAAAKA VTGIPAHQLP LRFGLVRGIP LFILGMLIAR LPTTLAPRLA 
DGLAIAAGVG VVALQVVGRF DHASLALLGL LIYAAGASGA KGWGWASLAG RLSFSLFLTN 
QLVAVVWFGL LRAVAGKLGF DDPLLWLTWA MALPACVIAA WLFERFVDAP LQVWIKGWSR 
REPATKAEPA LA