Gene Cagg_2970 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2970
Symbol
ID	7266501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	3640632
End bp	3642113
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	52%
IMG OID	643567792
Product	phytoene desaturase
Protein accession	YP_002464266
Protein GI	219849833
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1233] Phytoene dehydrogenase and related proteins
TIGRFAM ID	[TIGR02734] phytoene desaturase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000576965
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCCAAA AGGAGATTGT CGTAATTGGG AGTGGGTTTG GGGGGCTTAG TGCTGCTATT 
CGGCTTGCGG CGCAGGGCCA TTCGGTGACG ATCCTCGAAC AACGTGATCG CCCCGGTGGT 
CGCGCCTATG TCTATCAAAC GAAAGGCTAT ACCTTTGATA GTGGACCGAC GGTGATTACT 
GCGCCGTTTA TGTTTGATGA ACTATGGCAG TTAGCCGGTA AGCGACGCGA AGATTATGTG 
ACGTTCGAGC CATGCCGACC GTATTATCGT CTCTTCAACC ATGAGGGCCG CTACCTTGAA 
TATGGTGATG ATGAACAGGC TTTGCTTGAG CAGATCCGCC GGTGGAATCC GGCTGATGTG 
GAAGGGTATC GCCGTTTTAT TGCTAGCACT CGCCCAATCT TTGAAAAGGG TTTTAGCTTG 
ATCGATAAGC CGTTTCTTCA TTTTCGCGAT ATGTTACGGG TGACCCCCGA CCTGATCCGG 
CTCAAATCGT ATCAAAGTGT TTATCAGTTT GTCTCACAGT TTTTCCAAGA TGATTTTCTC 
CGCCGTTGCT TCTCGTTCCA TCCACTCTTT ATCGGGGGGA ATCCGTTTGA CTCAACGTCG 
ATCTATGCGA TGGTGCATTA CCTTGAGCGG CGGTGGGGCG TTTATCATGC TCGTGGTGGT 
ACCGGTGCTA TTGTAAAAGC AATGGTGCAA CTCTTTACTG AGTTGGGTGG TACACTCGAG 
TTGAACGCTA AGGCGGTAGA GATTGTGATC AATGGTCGTC GTGCCAGCGC CGTGCGTACT 
CAAGATGGTC GTCTGTTCCC GGCCGATATT GTGGTCTCGA ATGCTGATGT GCCACAGACG 
TATATGAGCT TAATCCCACC ACGGTATCGC AAAGTGCAGA CTGACCGCCG CCTGCGTCGG 
ATGCGCTACA GTATGTCGCT CGCCGTTATC TATCTCGGTA TTAATCGTCG TTATGATGAT 
GGTCGGTTGG TCCAGCACAA TATCATCTTT AGTGAACGGT ATAAGGGATT ACTCGACGAT 
ATCTTCAATC GAAAACGGCT TGCCGACGAT TTCTCGCTCT ATCTCCACCG TCCGTCGCAT 
AACGATCCAA CGTTAGCTCC GCCTGGTCAC GAGGCGCTCT ATGTCCTAAC GCCGGTGCCT 
AATCTGGCGG CGAACATCGA CTGGGCGACG GCTGGGCCTC GCCTACGCGA GGCAATTCTT 
ACCTTCCTTG AAGAGCATTA CATGCCTGAT CTGCGGCGCC ATATCGTGGT TGAACATATG 
GTCGATCCGC GCTACTACCG TGATGCTCTG AATAGCTACC TCGGTGCCGG CTTTTCGATC 
CAACCGCTCT TAACCCAATC TGCGTGGTTC CGTCCACATA ACCGTTCTGA AGATATCGAT 
AATCTGTATC TGGTAGGAGC AGGTACTCAT CCCGGTGCCG GCTTACCCGG TGTGATTGCT 
TCGGGTGCGA TTGTTGCTCA TTTAGTGGCT CAAGAGGCCT GA

Protein sequence

MTQKEIVVIG SGFGGLSAAI RLAAQGHSVT ILEQRDRPGG RAYVYQTKGY TFDSGPTVIT 
APFMFDELWQ LAGKRREDYV TFEPCRPYYR LFNHEGRYLE YGDDEQALLE QIRRWNPADV 
EGYRRFIAST RPIFEKGFSL IDKPFLHFRD MLRVTPDLIR LKSYQSVYQF VSQFFQDDFL 
RRCFSFHPLF IGGNPFDSTS IYAMVHYLER RWGVYHARGG TGAIVKAMVQ LFTELGGTLE 
LNAKAVEIVI NGRRASAVRT QDGRLFPADI VVSNADVPQT YMSLIPPRYR KVQTDRRLRR 
MRYSMSLAVI YLGINRRYDD GRLVQHNIIF SERYKGLLDD IFNRKRLADD FSLYLHRPSH 
NDPTLAPPGH EALYVLTPVP NLAANIDWAT AGPRLREAIL TFLEEHYMPD LRRHIVVEHM 
VDPRYYRDAL NSYLGAGFSI QPLLTQSAWF RPHNRSEDID NLYLVGAGTH PGAGLPGVIA 
SGAIVAHLVA QEA