Gene Plav_2698 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_2698
Symbol
ID	5456574
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	+
Start bp	2902292
End bp	2903506
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	68%
IMG OID	640878275
Product	beta-ketoadipyl CoA thiolase
Protein accession	YP_001413963
Protein GI	154253139
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02430] beta-ketoadipyl CoA thiolase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.398036
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCATC AGATCAGAGA CGCTTTCATT TGCGACGCCG TGCGGACGCC TATCGGGCGC 
TATGCGGGGG CGCTGGCGCA GGTGCGCGCG GACGATCTCG GCGCGGTGCC GCTGATGGCG 
CTGATGGAGC GGAACCCGGA TGTGAACTGG GAGCGGGTGG ACGATGTGAT CTTCGGCTGC 
GCCAACCAGG CGGGCGAGGA CAACCGGAAC GTGGCGCGGA TGTCGGCGCT GCTGGCGGGG 
CTGCCCGAAG GCGTGCCGGG ATCGACGGTG AACCGGCTCT GCGGCTCGGG CATGGATGCC 
GTCGGCACGG CGGCGCGGGC AATCAAATCG GGCGAGGCAT CGCTGATGAT CGCCGGCGGC 
GTGGAGAGCA TGTCGCGCGC GCCCTTCGTG ATGGGGAAGG CGACGAGCGC CTTTTCGCGC 
GATGCGGAGA TTTACGACAC GACTATCGGC TGGCGCTTCG TGAACCCGCT GATGAAGCGG 
CAATATGGCG TCGACTCCAT GCCGGAGACG GCGGAGAACG TGGCCGAGGA TTTCCAGATT 
TCACGCGCCG ACCAGGATGC CTTTGCGTGG CGGAGCCAGC AGCGTGCCGG ACGGGCCATC 
GAAGAGGGGC GTTTCGCGCA GGAGATCGTG CCGGTGACGA TTGCGAGCCG CAAAGGCGAG 
ACGGTGGTGA GCGCGGACGA GCACCCGCGG CCAGAAACGA CGCTCGAGGC GCTCGGCAAG 
CTCAAGGCGC CGTTCCGCGA AGGCGGCACG GTGACGGCGG GGAACGCATC GGGCGTGAAT 
GACGGTGCCT GCGCGCTCAT CATTGCGTCG GCCGACGGAG CGGAGGCGAA CGGGCTTCGC 
CCGCGGGCGC GGATCGTGGC GATGGCGACG GCGGGCGTTC CGCCGCGCAT CATGGGTATG 
GGGCCGGCGC CAGCGACGCG CAAGGTGCTG GAAAAGACGG GGCTCAATAT CGGCGATATC 
GACGTGATCG AACTCAACGA GGCTTTCGCC TCGCAGGGGC TTGCCGTGCT GCGCGATCTC 
GGGCTGCCGG ACAATGCGGA TCACGTGAAC CCGAATGGCG GCGCCATCGC GCTCGGCCAT 
CCGCTCGGCA TGAGCGGGGC GCGGCTGGTG ACGACGGCGA TGTACGAACT GGAGAAGCGC 
GACGGGCGCT ATGCGCTGTG CACGATGTGC ATCGGCGTGG GGCAGGGCAT TGCGATGGTG 
ATCGAGAGGG TTTGA

Protein sequence

MTHQIRDAFI CDAVRTPIGR YAGALAQVRA DDLGAVPLMA LMERNPDVNW ERVDDVIFGC 
ANQAGEDNRN VARMSALLAG LPEGVPGSTV NRLCGSGMDA VGTAARAIKS GEASLMIAGG 
VESMSRAPFV MGKATSAFSR DAEIYDTTIG WRFVNPLMKR QYGVDSMPET AENVAEDFQI 
SRADQDAFAW RSQQRAGRAI EEGRFAQEIV PVTIASRKGE TVVSADEHPR PETTLEALGK 
LKAPFREGGT VTAGNASGVN DGACALIIAS ADGAEANGLR PRARIVAMAT AGVPPRIMGM 
GPAPATRKVL EKTGLNIGDI DVIELNEAFA SQGLAVLRDL GLPDNADHVN PNGGAIALGH 
PLGMSGARLV TTAMYELEKR DGRYALCTMC IGVGQGIAMV IERV