Gene Cagg_1142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1142
Symbol
ID	7267890
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1411061
End bp	1412110
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	61%
IMG OID	643565985
Product	hypothetical protein
Protein accession	YP_002462488
Protein GI	219848055
COG category	[I] Lipid transport and metabolism
COG ID	[COG3425] 3-hydroxy-3-methylglutaryl CoA synthase
TIGRFAM ID	[TIGR00748] hydroxymethylglutaryl-CoA synthase, putative

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.448183
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000356194
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATGAAAC CGAACCAACC TGTCGGCATT ATCGGCTATG GCGTGTACAT CCCACGTTAC 
CGGATCGCAG CGCGCGAAAT TGCTCGGATC TGGACAGACG GTCAGAATGG CGTCCCCGTG 
GAGGCAAAGA GCGTTCCCGG CCCCGATGAA GACACGATTA CGATGGCAAT TGAAGCGGCG 
CGTAATGCGC TGGTGCGTGC CGACATTCCG GCTAGCGCAC TCGGTGCGGT CTGGATCGGG 
AGCGAAAGCC ATCCCTACAG CGTGAAACCA TCGGGGACGG TAGTAGCCGA CGCACTCGGC 
GCCGGGCCAT GGGTGAGTGC CGCCGACTGG GAATTCGCAT GTAAGGCCGG CTCCGAAGCG 
CTGACCGCGG CGATGGCACT GGTCGGCAGT GGGATGCAGC GCTACGCCTT GGCGATCGGC 
GCCGACACTG CCCAGGGGCG TCCCGGTGAT GCGCTGGAAT ACACTGCTTC CGCCGGCGCA 
GCAGCGTTGA TCGTTGGTCC TGCCACCGAA GCGTTGGCGA CCATCGATGC AACCGTCTCG 
TATGTCACCG ATACCCCTGA CTTCTACCGC CGCGCCGACC GACCGTATCC GGTACACGGC 
AACCGCTTCA CCGGCGAGCC GGCGTACTTC CACCAGATTC AATCGGCAGC CTCTGAATTA 
TTACGTCAAC TCAACCGTAC TGCTGCCGAC TTTACCTATG CCGTCTTCCA TCAACCTAAT 
GCGAAATTTC CCCAGACGGT TGCCAAACGA CTCGGCTTCA CCGATGCCCA AATCGCGCCG 
GGATTGCTCA GTCCACAGAT CGGTAATACC TATTCGGGCG CCGCACTGCT AGGCCTGTGT 
GCCATTCTCG ATGTCGCCAA ACCGGGCGAT ACCATCTTCG TAACGAGCTA CGGTAGTGGG 
GCCGGTTCCG ACGCTTATGC CCTCACCGTC ACCGAAGCGA TTGTGGAGCG ACGCGAGCGA 
GCGCCATTGA CGGCAGCGTA CCTCGCCCGC AAGGTGATGA TCGATTACGC AATGTATGCG 
AAATGGCGCG GTAAGTTGGT GATGGGCTAG

Protein sequence

MMKPNQPVGI IGYGVYIPRY RIAAREIARI WTDGQNGVPV EAKSVPGPDE DTITMAIEAA 
RNALVRADIP ASALGAVWIG SESHPYSVKP SGTVVADALG AGPWVSAADW EFACKAGSEA 
LTAAMALVGS GMQRYALAIG ADTAQGRPGD ALEYTASAGA AALIVGPATE ALATIDATVS 
YVTDTPDFYR RADRPYPVHG NRFTGEPAYF HQIQSAASEL LRQLNRTAAD FTYAVFHQPN 
AKFPQTVAKR LGFTDAQIAP GLLSPQIGNT YSGAALLGLC AILDVAKPGD TIFVTSYGSG 
AGSDAYALTV TEAIVERRER APLTAAYLAR KVMIDYAMYA KWRGKLVMG