Gene Cagg_3738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3738
Symbol
ID	7267811
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4553631
End bp	4554917
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	53%
IMG OID	643568545
Product	citrate synthase I
Protein accession	YP_002465010
Protein GI	219850577
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID	[TIGR01798] citrate synthase I (hexameric type)

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.680995
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.033422
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAAAA ACTCCCTCAC TGTTATCGAC AACCGTACCG GTAAGACCTA CGAAATTCCG 
ATTGAGCATG GCGCCATCCG GGCAACCGAT TTACGCCAGA TCAAAGTCTC TGACGACGAT 
TTTGGCTTGA TGTCGTATGA TCCGGCTTAT CTCAATACTG CTTCGTGCAA GAGTAGCATC 
ACCTTCATTG ACGGTGACAA AGGCATTCTC GAGTATCGCG GTTATCCGAT CGAACAGCTT 
GCGGAGCAAA GCTCGTATCT CGAAGTAGCC TATCTCTTGC TCTATGGTGA GCTACCATCA 
AAAGAGCGAT TGGAGTGGTG GGAATATCGC ATTAGTCGCC ATCTGTTCTT ACACAATAGC 
CTCGTCGAGT TGATTCAGGC CTTCCGCTAC GATGCGCATC CGATGGGTAT CTTGATCAGC 
TCGGTAGCGG CGATGTCGAC GTTGTACCCC GAAGCGAAAA ACATTCACGA TCCTGCCGTG 
CGCGAGAAGC AGATTTGGCG TATTATCGGT CAGATTCCAA CCATCGCTGC GTTTGCCTAT 
CGACACCGCA TCGGACGACC GTTTAACTTG CCCGATAGTT CGCTGAGCTA CACGGCCAAT 
TTGCTCTACA TGATGGACTA CATGAACCAA CGCGAATATG AAGTTAATCC GGTGTTGGCC 
AAGGCGTTAG ATGTGCTCTT CATCTTGCAT GCCGATCACG AGCAGAACTG CTCAACATCG 
GTGATGCGTA GTGTCGGTTC GAGCCACGCC GATCCCTACA ACGCGCTGGC AGCAGCAGCG 
GCGGCATTGT ATGGGCCGTT GCATGGTGGA GCCAATGAAG CCGTGTTGCG GATGTTGCAG 
CAGATTGGCC ATCCCAAGAA TGTGCCGGCA TTTATCGAGC GGGTGAAGAA GGGTGAGACC 
CGCCTGATGG GTTTTGGTCA TCGCGTCTAC AAGAACTACG ATCCGCGAGC TAAGATTATT 
CGGCGCATTG CCCACGAAGT CTTTGCGGCC ACGGCGGCCA ATCCGTTGCT TGATGTGGCA 
ATGGAACTCG AGCGGGTGGC ATTGGAAGAT GAATACTTCA TCTCGCGCAA GCTCTATCCG 
AATGTTGACT TCTACAGTGG TTTGATCTAT CAAGCATTGC GCTTCCCCAT CGAGTACTTC 
CCCTTCCTGT TTGCCATTCC GCGTGCATCG GGTTGGTTGG CGCAGTGGCT TGAGATGCTC 
GACGATCCTG AGCAGAAGAT TACGCGACCG CGGCAGGTGT ATGTTGGCCC GCAGCGGCGT 
GATTATGTGC CGATCGATCA GCGCTGA

Protein sequence

MTKNSLTVID NRTGKTYEIP IEHGAIRATD LRQIKVSDDD FGLMSYDPAY LNTASCKSSI 
TFIDGDKGIL EYRGYPIEQL AEQSSYLEVA YLLLYGELPS KERLEWWEYR ISRHLFLHNS 
LVELIQAFRY DAHPMGILIS SVAAMSTLYP EAKNIHDPAV REKQIWRIIG QIPTIAAFAY 
RHRIGRPFNL PDSSLSYTAN LLYMMDYMNQ REYEVNPVLA KALDVLFILH ADHEQNCSTS 
VMRSVGSSHA DPYNALAAAA AALYGPLHGG ANEAVLRMLQ QIGHPKNVPA FIERVKKGET 
RLMGFGHRVY KNYDPRAKII RRIAHEVFAA TAANPLLDVA MELERVALED EYFISRKLYP 
NVDFYSGLIY QALRFPIEYF PFLFAIPRAS GWLAQWLEML DDPEQKITRP RQVYVGPQRR 
DYVPIDQR