Gene Cagg_1559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1559
Symbol
ID	7267336
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1907124
End bp	1909436
Gene Length	2313 bp
Protein Length	770 aa
Translation table	11
GC content	61%
IMG OID	643566401
Product	aldehyde oxidase and xanthine dehydrogenase molybdopterin binding
Protein accession	YP_002462897
Protein GI	219848464
COG category	[C] Energy production and conversion
COG ID	[COG1529] Aerobic-type carbon monoxide dehydrogenase, large subunit CoxL/CutL homologs
TIGRFAM ID	[TIGR02416] carbon-monoxide dehydrogenase, large subunit

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.755878
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTATG CAGCCCTGAT TGGCGCAGAA GTGAAACGCC GCGAAGATCC GCGTCTCATC 
CGGGGTCAGG GCACGTATGT GAGCGATTTG CGTCTACCGG GGATGTTATA CGTTGCCATT 
GCCCGTAGTC CGTATACCCA CGCCCGGATT ATCGCCATCG ACAAAGCTGC CGCGCTGGCG 
ATGCCTGATG TCGTAGCCGT CTATACCGGC ACCGACCTGC TCGCTTGTTG TCAGCCATTG 
CCGTTGGCCA GCTCAGGCGA AGGCGGCGGC GGGCCACAGC GCTACACGGG CCGCACTCGC 
TATGTGCTGG CGGTAGAGCG GGTGCGTCAC GCCGGTGAAG CGGTCGCCGC AGTGATCGCC 
CGGACGCCAG AAGCCGCGCT CGATGCCGCG CTTGCCTTGC CCATTGAATG GGAGCCACTA 
CCGGCAGTGG TTGATCCGCT CACCGCAATT GCCCCCGACG CCCCGATCAT CTTCGATGGT 
CTGCCTGACA ATATTGACCA CCGTCGTCGC CGGCAAAAGG GTGATGTCGA GGCCGCCTTC 
GCCACTGCTC ATCGGGTTAT CCGCCAACGA ATGGTCAATC AACGTCTGCT CGGTTTCCCG 
ATGGAAGGAC GCGCAGTGGT TGCTGCGCCC GACCCCGCTA ACGATGGTGT GACGGTATGG 
ACGAGTACGC AGACCCCGCA CCAGGTGCGT GGCGAGATCG CTAAAGTGGT CGGCCTTGAC 
GAGAATCGGG TGCGCGTGAT TGCGCCTGAT GTCGGCGGTG GCTTCGGGGT TAAGATCGGT 
ATCTACCCCG AAGAGGCGCT GCTGGCAGCG CTAGCCCGTC AGCTTAATAC ACCATTGCGT 
TGGATCGAAC ACCGCCTCGA ACATGTACAG GCAACGACTC ACGGACGCGG GCAAGTGTGC 
GATGTCGAGG CTGCCGTTAC CGCTGATGGC GAAGTGACTG CGCTGCGTAT GCAGATCGTA 
GCCGATCTCG GCGCTTATCC TCTCGCCCCC GGTCTACCCG ATCTGACCAC TGCCATGGCT 
ATTGGCGTCT ACAAAATCCC TGCCGTCGAT CTGGAAGCAA TTTGTGTTTA TACCAATACC 
ACACCGGTCG CTGCCTACCG TGGTGCGGGT CGGCCCGAAG CTGCGTACTA TATCGAACGA 
CTGATGGATC TGATTGCCGC TGAATTGCAT ATCGATCCCG CCGAGGTTCG TCGCCGTAAC 
TTCATTCCCC CCGACGCCTT CCCGTACAAG ACGCCGACCG GCCTGACGTA TGATAGCGGC 
GAGTACGATC GCGCCCTGAC TAAAGCTTTG ACATTATCGC GATACGAACA GTTACGCGCC 
GAACAAGCTG CCCGCCGCGC CGCTGATGAC CGGATGTTGC TCGGCATCGG GATTGCCTGT 
TATGTCGAGA TGTGCGGCTT CGGCCCCTAC GAAAGCGCTC AAATCAAGGT CGAACCGAGC 
GGTACGGTGA CGGTGACGAC CGGCATCTCG CCGCACGGTC AGGGCACTGC CACCACCTTC 
GCCCAGATCG TCGCCGACCA GATCGGGGCT GACTTTGAGC GGATTGTGGT TAAGCACAGC 
GACACCGCGA TCACGCCGAT GGGTATCGGG ACGATGGGGT CACGGTCGTT GGCCGTTGGT 
GGCGCAGCGC TCGTGCGGGC AGCGACAAAG GTACGCGAGA AAGCACGCCA GATTGCGGCA 
GCCATGCTTG AAGCTAGTGT GGCCGATATT GAACTGCACG AGGGTCGCTA TCGGGTACGC 
GGCGTGCCCG ACCGTGCCCT GACCCTAACC GAGATTGCCC GTCGCGCCTA CAGTAACAAA 
CTCCCGCCAG ACCTCGATCC CGGTTTGGAA GCGGTCGATT ACTTCCGTCC ACCCGACCTG 
ATCTATCCCT TTGGCGCGCA CGTCGCCGTG GTCGAAGTCG ATCGCGAAAC CGGCCACGTT 
CGCATCCGCG AGTACTACTC GGTTGATGAT TGCGGGCCGC GCATTAGCCC ACTGATCGTT 
ACCGGTCAGG TGCATGGTGG GTTGGCCCAA GGTATTGCTC AAGCGCTCCT CGAAGAGGTC 
GTGTACGACG CAAACGGCCA ATTGCTCAGT GGTACCCTGA TGGATTACGC CTTACCGCGC 
GCCGACTTCT TCCCACCCTT CACAGTTGAT AAGACCGAAA CGCCGACTCC GCTCAACCCG 
CTCGGCGTCA AGGGTATCGG TGAAGCGGCA ACCATTGGTT CAACACCGGC TATTGCGAAC 
GCGGTGATCG ACGCACTCGC ACCGTTTGGC GTGCGCCATC TTGATATTCC ACTCCGCTCA 
GAAAAGATCT GGCGAGCAAT CCACGGCCGA TAA

Protein sequence

MAYAALIGAE VKRREDPRLI RGQGTYVSDL RLPGMLYVAI ARSPYTHARI IAIDKAAALA 
MPDVVAVYTG TDLLACCQPL PLASSGEGGG GPQRYTGRTR YVLAVERVRH AGEAVAAVIA 
RTPEAALDAA LALPIEWEPL PAVVDPLTAI APDAPIIFDG LPDNIDHRRR RQKGDVEAAF 
ATAHRVIRQR MVNQRLLGFP MEGRAVVAAP DPANDGVTVW TSTQTPHQVR GEIAKVVGLD 
ENRVRVIAPD VGGGFGVKIG IYPEEALLAA LARQLNTPLR WIEHRLEHVQ ATTHGRGQVC 
DVEAAVTADG EVTALRMQIV ADLGAYPLAP GLPDLTTAMA IGVYKIPAVD LEAICVYTNT 
TPVAAYRGAG RPEAAYYIER LMDLIAAELH IDPAEVRRRN FIPPDAFPYK TPTGLTYDSG 
EYDRALTKAL TLSRYEQLRA EQAARRAADD RMLLGIGIAC YVEMCGFGPY ESAQIKVEPS 
GTVTVTTGIS PHGQGTATTF AQIVADQIGA DFERIVVKHS DTAITPMGIG TMGSRSLAVG 
GAALVRAATK VREKARQIAA AMLEASVADI ELHEGRYRVR GVPDRALTLT EIARRAYSNK 
LPPDLDPGLE AVDYFRPPDL IYPFGAHVAV VEVDRETGHV RIREYYSVDD CGPRISPLIV 
TGQVHGGLAQ GIAQALLEEV VYDANGQLLS GTLMDYALPR ADFFPPFTVD KTETPTPLNP 
LGVKGIGEAA TIGSTPAIAN AVIDALAPFG VRHLDIPLRS EKIWRAIHGR