Gene Cagg_1072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1072
Symbol
ID	7268524
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1324542
End bp	1326170
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	57%
IMG OID	643565917
Product	hypothetical protein
Protein accession	YP_002462422
Protein GI	219847989
COG category	[R] General function prediction only
COG ID	[COG1353] Predicted hydrolase of the HD superfamily (permuted catalytic motifs)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCTACC TCTTGGCCGC CGAGGCCGAT AAGATTCAGG ATTTCATCTT TCGCTCTTCG 
CGCTTGCGCG AAGTGGTTGG GGCGAGTCAG TTGCTGACTC GCTTCTGCCG TAGCGTCGAA 
GATACCTTGG CGAAGCAGTA CAACGGTCAG GTTGTGGTCA ACGATGGTGG TAGTTTTCGG 
GTGATCTTTG ACGATCGAAA TGACGCGGTT GCTTTCGGCG CCGATCTGGC TGAACGCTAC 
CGGCTGGCGT TGGGTGGCAG TCTGACAGTT GCTGAGCCTG TAGCGATGAA CAGTGATTTC 
CGCACGGCCA ATGATGAAGC CGGTACAAAG TTGCGCTGGG CGAAGAGTCA TCGGCAGGGA 
GTAGTAGCCG AAGTGCATAT GCCGTATGTC GCATTCTGCG AGTCGTGTGG CGTGGGGTTG 
GCGGAACGGC GTGATCGGCT GGCGGGAAGG AACGATTCCC GCCACAGGTA TCTGTGTGCG 
ACCTGTCAGA TCAAAGCAAC TGAGCGTGAT CGTGGTCTGC GCGAATTCCT TGGTGGAGTG 
TACGATCCTT ATGCTAAGAA AGCGGCAATT CCTGCCCACA TTGAACCCGA TTGGCCCGAA 
GACGCCGATG CCATTGCCGT TTTTGACCTG AGTAAACGAA ACTACGTAGC CTATTTGGTG 
GCCGACGGCA ACGGTATGGG TCAATTATTC GGCAATTGTG ACCAGGGGCA GCTCCAGAAC 
CTTTCGCAAG GTCTATCAAC GGTGCTGAGT GAGAGTCTGG CCGTTCCGAT GATTGAGTTC 
CGCAAGCAAG TTCCGGCACA GGCGACGATG ATGCCGATGC TCCCGCTCAT TCTCGGTGGT 
GATGATCTCT TTGCACTTGT GCCGGCGTCG TATGCGCTCG ATATTGCCCG TCGCTTCTGC 
CTCGAATGGG AAGAGCGTAT GCAGATGCTG GTAAATAAGA TAGGTCTGCA CAATGTGCCT 
CGCCCGACGA TTGCCGCAGC AGTGGTGATT TGCAAGCGTA CCTATCCGTA TGCACTGGCC 
CATCGCCGGG CCGAAGCTTT GCTGGAGGAT GCCAAGCGCC AGAGCAAATT GCTGGCTGCC 
AAGACGAACG GGCATCTATC GGCGGTCAAT TTCGAGGTCA TTTTGGGCAA TCGGTTGGCG 
GGTATGGCCG AGGCAGACGG TGATCAGGTC ATCCGGCGCT CGTTACGTCC GTATTGGGTC 
GCAGAGCACG ATCTCTCGAA AGACGCCTTG CTGCGCGGGA TCGACCTCAA GCATCTGCTG 
GCGCAGCGCT ATGCCCTGAA AGATCTTCCC CGGAAGCGTC TGGCCGAATT GCGCCGTTGT 
TTTGCCGAGG TGCAGACGGA TATTCCTGTG CAGCAGCGTA CCCAAAACTT AGAACGGTGG 
ACGCAGCATC GGCTCGAATG GATTTTGGAG CGATTGAGTG CAGCTTCACG TTCGGCGGTA 
GTCGATGCGC TTGCGGTGCT GGGCAAGCCC AAGAACGACG GGAATGGCGC TCACTATTGG 
CGCAGTATCA CGCGCGATAA CCGCGATGTG GTCGTTCACG GCATGCTCGA TCTGCTGGAA 
GTTTGGGAGT TTGCGCAGGA GTTGAGTCAT AACCCCGACG ATTATGAACC GCAGGAGGAC 
GAGGCATGA

Protein sequence

MPYLLAAEAD KIQDFIFRSS RLREVVGASQ LLTRFCRSVE DTLAKQYNGQ VVVNDGGSFR 
VIFDDRNDAV AFGADLAERY RLALGGSLTV AEPVAMNSDF RTANDEAGTK LRWAKSHRQG 
VVAEVHMPYV AFCESCGVGL AERRDRLAGR NDSRHRYLCA TCQIKATERD RGLREFLGGV 
YDPYAKKAAI PAHIEPDWPE DADAIAVFDL SKRNYVAYLV ADGNGMGQLF GNCDQGQLQN 
LSQGLSTVLS ESLAVPMIEF RKQVPAQATM MPMLPLILGG DDLFALVPAS YALDIARRFC 
LEWEERMQML VNKIGLHNVP RPTIAAAVVI CKRTYPYALA HRRAEALLED AKRQSKLLAA 
KTNGHLSAVN FEVILGNRLA GMAEADGDQV IRRSLRPYWV AEHDLSKDAL LRGIDLKHLL 
AQRYALKDLP RKRLAELRRC FAEVQTDIPV QQRTQNLERW TQHRLEWILE RLSAASRSAV 
VDALAVLGKP KNDGNGAHYW RSITRDNRDV VVHGMLDLLE VWEFAQELSH NPDDYEPQED 
EA