Gene Cagg_0851 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0851
Symbol
ID	7268303
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1059006
End bp	1060487
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	61%
IMG OID	643565699
Product	chlorophyllide reductase subunit Z
Protein accession	YP_002462208
Protein GI	219847775
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01278] light-independent protochlorophyllide reductase, B subunit [TIGR02014] chlorophyllide reductase subunit Z

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00549555
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATTA CGCTGATCCG TGATATTTCC GATACCAGTA GCTACTGGGG TGTGTCGTGG 
GTGTTCGGCT GCTTCCCCGA CGTTCATATC GTCTGCGATG CACCGATCGG CTGCTACAAC 
CTGCTCGGTA TGGCAGTGAC CGACTATACC GATGCGCTAC CCCACATGGC AAACCTCACC 
CCGACCTCGA TCCGCGAGGA GGATGTGATC AACGGTACGG CCAAGGCGCT GATCCGTACC 
ATCGACGATC TGCGCACGAT GGGGATGCTG GCAGGCAAAC GGCTGCTGGT CGTTTCGACC 
GCCGAGAGCG AGATGATCAG CGCCGATCAC GCTCAACTAG TAGCGCAGAT CGATCCCGAA 
GCGCGGTTCT TCTGGAGCCA ATCACTCGAA CAGGATGAGT GGACGGGACG CGAGCGAGCG 
TTATTGTTTG CGTGGGAACA GTACGGTAAA CCATTTGTGC CGGCAGATGT GCAACCACGT 
CCGCGCACGG TCAATATCAT CGGCCCCTCG TTGGGATGTT TTAACGCACC TAGCGACCTC 
TACGAACTCA AGCGGTTGAT CACCGGCATC GGCGCCGAGA TTAACCTCGT CTACCCCTAC 
GAAGGCAGTA TCGCTACCAC CCCCAAGCTG GCGGAAGCGG CAGTCAACGT CGTGATGTAC 
CGCGAGTTTG GTCAAGGTCT AGCCGAAGCA TTGGGCCGGC CCTACCTCTT CGCGCCGTTC 
GGGGTCTTTG GCACCACTGC GTTTCTGCGC GAACTAGGCC AACTCCTTGG GATTGAGCCG 
GAGCGTGTCG AAGCCTTCAT CAACCACGAA AAGCGCACTA CACTGCAACC GGTGTGGGAT 
CTGTGGCGCG GCCCGCAGAG TGACTGGTTT GCGACGGTTG ATTGCGCCAT TGTCGCGGCG 
CGCAGCTACG CCGACGGGTT GCGCAGCTTT CTCGGCGACG AGCTGGGGAT GAAGATCGCG 
TGGATCTCGG GGCGACCCCG CCGCGACGAC GAGCCGGATA ATATCGAGAT TCGGAAGCGG 
TTGCACGCCA AGGCGCCGGC GTTCGTGTTC GGTAGCATTA ACGAGAAGAT CTATCTGGCC 
GAAGCTAATG CGCGCGGTAC GCACTATATC CCGGCCACCT TCCCCGGCCC GGTGGTGCGG 
CGCACAACGG GCACGCCGTT TATGGGGTAT GCCGGCGCGG CCAACCTGAT GCAAGAGCTG 
GTCAACCGCT TCTACGAGAC GGTGATCAAC TTCTTGCCGG TCGAGACGGT AACACCGGCA 
GCAGGTGGGC CACCGCAGCC AACCTCTGCC GAAACGATAC CGTGGACGAA AGAGGCGACC 
GACCGGCTCA ACGCTGCGCT CGACGCGGTG CCCTACCTTG CCCGCATCAG CGCCAGCCGT 
TCGCTGCGCG CCGCCGCCGA GCAAGCAGCG CGGGCGCGCG GGTTGAAAGA AGTCACGCTC 
GAAATCATCG AAGCGGCAAT TGCTCAGGGC GCGACCTCGT GA

Protein sequence

MSITLIRDIS DTSSYWGVSW VFGCFPDVHI VCDAPIGCYN LLGMAVTDYT DALPHMANLT 
PTSIREEDVI NGTAKALIRT IDDLRTMGML AGKRLLVVST AESEMISADH AQLVAQIDPE 
ARFFWSQSLE QDEWTGRERA LLFAWEQYGK PFVPADVQPR PRTVNIIGPS LGCFNAPSDL 
YELKRLITGI GAEINLVYPY EGSIATTPKL AEAAVNVVMY REFGQGLAEA LGRPYLFAPF 
GVFGTTAFLR ELGQLLGIEP ERVEAFINHE KRTTLQPVWD LWRGPQSDWF ATVDCAIVAA 
RSYADGLRSF LGDELGMKIA WISGRPRRDD EPDNIEIRKR LHAKAPAFVF GSINEKIYLA 
EANARGTHYI PATFPGPVVR RTTGTPFMGY AGAANLMQEL VNRFYETVIN FLPVETVTPA 
AGGPPQPTSA ETIPWTKEAT DRLNAALDAV PYLARISASR SLRAAAEQAA RARGLKEVTL 
EIIEAAIAQG ATS