Gene Cagg_3044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3044
Symbol
ID	7267259
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	3702340
End bp	3703449
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	56%
IMG OID	643567864
Product	Rieske (2Fe-2S) domain protein
Protein accession	YP_002464338
Protein GI	219849905
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000332714
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGACCT TTGTCCGCGC ATCACTTGAT CGTCCGGCCT ACACCTTGCC CGGCTATTAT 
TTTAGCGCAA CCGACATCTT TATACGTGAA CAAGACCGTA TCTTTGCGCG CACGTGGGTC 
TGCGTCGGGC GGAGTGAAGA TGTCGCTACT GCCGGTGCGT ACTGTCTGAT CGAGGTCGCT 
GGCGAAAGCC TTATTCTCCT ACGCGACCAG ACCGGTCAAC TCCATGCACA TTATAACGTC 
TGTCGTCATC GCGGAGCACG TCTCTGCACA GAGTTGCAAG GTCAGTTAAG CGAAACGATT 
GTCTGTCCGT ACCATGCATG GACGTATCGG CTCGATGGGA CGCTGGCGAC CGCGCGCTAT 
ATGCAGGATG CGCCGGGGTT TCGCTGTGAA GACTGGCCGT TACTGAGTGC TGCCGTCGCC 
GAATGGGATG GGTTTGTGTT CGTATCACTG GCCGAACAGC CCGTTGCATT CGAGCGCGCG 
TTTGCGCCGC TCATCGGAAA GTTTCAGGCA TGGGACCCGG GGCGATTGCG CTGCGGCGCC 
CAGATTGTAT ACGAAGTGGC GGCCAACTGG AAGCTGATTA TCGCTAACTA TTCGGAGTGT 
TACCATTGCC CGCTTATTCA CCCCGAACTC GTAGCCGTTT CTCCGTGGCA AAGCGGGCGC 
AACGATCTGA CGAGTGGCCC GTTTCTCGGT GGATATATGG ATCTGAAACA CGAGAGCATG 
ACGCTAGACG GTCATACTCG TCGCTCGCCA TTGCCCGGTC TAAACGCCGA AGATCGGCGG 
CGCGTTTATT ACTACGCTAT CTTTCCCAAT CTGCTCCTCA GCCTCCATCC CGATTACGTG 
ATGGCGCATC GTCTCATCCC GCGACGCCCT GATGCAACGA CGATTGTCTG TTCCTGGTAC 
TTTGCGCCGG AAGTGATGGC TCTACCCGAT TTCGATCCTT CTGATGCCGT TGAGTTTTGG 
GATCACACCA ACCGCCAAGA CTGGCGCGTC TGTGAGTTAT CGCAGCAAGG AGTCAGTTCA 
CGTGCGTATC GCCCCGGTCC GTATGCTCAA TCAGAAGGAT TGTTGTGGCA GTTCGATCAG 
GAATATCTAC GGGTCATGGG TGAGGAATAA

Protein sequence

MTTFVRASLD RPAYTLPGYY FSATDIFIRE QDRIFARTWV CVGRSEDVAT AGAYCLIEVA 
GESLILLRDQ TGQLHAHYNV CRHRGARLCT ELQGQLSETI VCPYHAWTYR LDGTLATARY 
MQDAPGFRCE DWPLLSAAVA EWDGFVFVSL AEQPVAFERA FAPLIGKFQA WDPGRLRCGA 
QIVYEVAANW KLIIANYSEC YHCPLIHPEL VAVSPWQSGR NDLTSGPFLG GYMDLKHESM 
TLDGHTRRSP LPGLNAEDRR RVYYYAIFPN LLLSLHPDYV MAHRLIPRRP DATTIVCSWY 
FAPEVMALPD FDPSDAVEFW DHTNRQDWRV CELSQQGVSS RAYRPGPYAQ SEGLLWQFDQ 
EYLRVMGEE