Gene Cagg_3767 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3767
Symbol
ID	7267840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4591698
End bp	4592729
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	57%
IMG OID	643568574
Product	Transketolase domain protein
Protein accession	YP_002465039
Protein GI	219850606
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTGGG ATCAAGGTTT GCATAAGACG ACAACAACGA TCACCGATGA GCAGGGGACG 
CGCGAACTGA CCTATCTGGA AGCGATCCGA GCGGCGTTGC GGTACGAGAT GCAGCGCGAC 
CTGCGGGTGC TGATTATGGG GGAAGACATT GGCGTCTACG GTGGCGCATT TAAGGTGACG 
CAAGGGTTGA TCGAGGAGTT TGGCGAAGAT CAGGTGATCG ATACTCCGAT GACCGAGCTG 
GCAATGATCT ACGCTGCCAT CGGTATGTCG TTTGAAGGTT TCTTGCCGGT AGTCGAGATG 
CAGTTCGCCG ATTTCATCTC AACCGGATTT GACGCCATCG TCCAGTTTGC GGCTACTAAC 
CATTTTCGCT GGCGGCAGCC TGTGCCGATT ACGATCCGTG CGCCCGGTGG TGGTGGCTTG 
CGTGCCGGTC CGTTTCACTC GCAGTCGAAT GAAGCATGGT TTGTGCATAC TCCCGGCTTG 
AAGGTCGTGG CGCCGGCTAC GCCTGCCGAT GCCTACGGTC TATTGCTGAG CGCTATCCGT 
GATCCCAACC CGGTGATTTA CTACGAGACC AAATATCTCT ATCGGTCGCT GAAGGGACCG 
GTGCCGGAAG GAGAGAGCCT GGTGCCGATC GGTCAAGCGG CATTGCGGCG TAGTGGTGAA 
GAGTTGAGTA TCATCGCGTA TGGCGCGATG GTGCAGGAGG CGTTGCAAGC GGCGATCATC 
CTGGAGCGTG AGGGTCATAG TGTTGAAGTG CTCGATCTGC GCACCCTCAA ACCACTCGAT 
GAAGCGGCAA TTCTGGCAAC AGTACAGAAG ACCGGCAAGG TGCTGATCGT CCATGAAGCG 
AACCGCACCT GTGGCGTAGG CGGTGAAGTG GCGGCGATTA TTGCCGAGCG TGCCTTTGAG 
TATCTCGACG GGCCGATTAC TCGCCTTGCG GCACCCGATA CCCCGGTTCC TTATAGCCCA 
CCCCTCGAAG ACGCATACCG ACCAAATGCT GCAAAAATCC TCGCCGCAGC ACGAGAATTG 
TTGGCATACT AA

Protein sequence

MTWDQGLHKT TTTITDEQGT RELTYLEAIR AALRYEMQRD LRVLIMGEDI GVYGGAFKVT 
QGLIEEFGED QVIDTPMTEL AMIYAAIGMS FEGFLPVVEM QFADFISTGF DAIVQFAATN 
HFRWRQPVPI TIRAPGGGGL RAGPFHSQSN EAWFVHTPGL KVVAPATPAD AYGLLLSAIR 
DPNPVIYYET KYLYRSLKGP VPEGESLVPI GQAALRRSGE ELSIIAYGAM VQEALQAAII 
LEREGHSVEV LDLRTLKPLD EAAILATVQK TGKVLIVHEA NRTCGVGGEV AAIIAERAFE 
YLDGPITRLA APDTPVPYSP PLEDAYRPNA AKILAAAREL LAY