Gene Cagg_0834 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0834
Symbol
ID	7268286
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1036954
End bp	1038603
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	55%
IMG OID	643565684
Product	protein of unknown function DUF344
Protein accession	YP_002462193
Protein GI	219847760
COG category	[S] Function unknown
COG ID	[COG2326] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGATC GCTGTATTAC CGATGTGTCG CTCTCTAAAG CGGAGTACCA GCGTTTAGTC 
CCTGAGTTGC AAGCGCGGCT CTTTGATCTG GAGCAGATGC TGCTCGAAGC GCGCATCCCG 
ACCATTTTCG TGTTTGAGGG CTGGGCCGGA ACGGCCAAGG CGCGCACGAT TGCGACACTT 
ACCCGTCGGC TTGATCCGCG TGGTTTTCGG GTGTATCCGA TCACGCCGCC ACGAACCTAC 
GAGCAGCAGT ATCCGTGGCT CTATCGCTTC TGGCTCAAGA TTCCCAGCTA TGGTCAGATG 
ACATTCTTTG ATCGGTCGTG GTATCGTGAA TTGCTGGCTG CCTATACGAC CGACGGTGAT 
CAAGATCGTT GGCGGACGCG CTGCGAAGAT GCGGTTGTTT TCGAGCGCCA ATTGGCCGAT 
GATGGGGCAT TCATCCTTAA GTTTTGGCTC CATATTACCA AAAAGCAGCA GGCTCGTCGC 
TTTAAGAAGT TGTTGTCCGA TCCGTTGCAG TCGTGGCGGG TAACCGATGA GGATCGTTGG 
CAACACCGTC ACTACAAGCG TGTCTACCGC GTAGTCGAGG AGATGCTGGT ACGCACCGAT 
ACCGCGTTTG CACCGTGGCA AATTGTTCCG GCGGCCGATA AATACTATGC GCGTTTGTAC 
ATTTTGCAGA CGATTGTCGG TGCGCTGGAA AGTCGCTTGG GCATCACTGC GATTGATCGG 
GGCGCCAGTA TTGATGATAG TGGTGAAGCA CTCCGCCGCT ACAACTTGTC GATCCGAATA 
CCGGTGCTGG GTGGTGCGAC CAACACAGAC ACGGTTCGTC CGTCACCATC GGCGGAAGAG 
GCCGGTCATC AGCTCACCAC AACACCAATG TCAAACGGAT CGGTGGTGGT AACGGTCCCG 
GTAGTGTCAC CAACCTACGC GGCTAGTCCG TTGCAACGGG TTGATCTCAG TCTGCGCCTC 
GACGATGAGA CCTATCATCG TGAGTTGAAA CGGTTGCAGG CTAAGCTGTA CTTGCTAGGG 
TTGCAAGTCT ACCATCAGAA ACGACCGGTG GTGATAGTGT TTGAGGGGTG GGATGCCGCC 
GGTAAAGGTG GGGCGATCCA GCGTCTGACT GCTGAACTCG ATCCACGGGC GTATATTGTG 
CATGCGATTG CAGCACCAAC CGGCGATGAC AAAGCGCGCC ACTACCTCTA CCGCTTTTGG 
CGACGCTTGC CACCGCGTGG TCAGTTTGCG GTGTTCGATC GCTCGTGGTA CGGTCGGGTC 
TTGGTTGAGC GGGTCGAAGG GTTCGCGCGG CCTGAGGAAT GGCGACGGGC CTACGCCGAA 
ATTAATCAGT TTGAACGTCA GTTGGTCGAT TTCGGCACTA TCATCGCGAA GTTTTGGTTA 
CACATCAGCC CTGAAGAGCA GTTACGTCGG TTTGAGCAAC GACAGAATGT GCCGTACAAA 
GCGTGGAAAT TGACCGACGA AGATTGGCGT AATCGTGAGA AGTGGCCGGC GTATCTCGCG 
GCAGTTGATG AGATGTTACT GCGCACCAGT ACACCATTTG CCCCGTGGAC GATAGTTGAA 
GCGGAGGATA AGAAGTTTGC TCGGATCAAG GTGTTACGGA CAGCGGTTGA TGTATTAGAG 
TCTGAGTTGG GAGTTGTAAA GCTGGAGTAG

Protein sequence

MLDRCITDVS LSKAEYQRLV PELQARLFDL EQMLLEARIP TIFVFEGWAG TAKARTIATL 
TRRLDPRGFR VYPITPPRTY EQQYPWLYRF WLKIPSYGQM TFFDRSWYRE LLAAYTTDGD 
QDRWRTRCED AVVFERQLAD DGAFILKFWL HITKKQQARR FKKLLSDPLQ SWRVTDEDRW 
QHRHYKRVYR VVEEMLVRTD TAFAPWQIVP AADKYYARLY ILQTIVGALE SRLGITAIDR 
GASIDDSGEA LRRYNLSIRI PVLGGATNTD TVRPSPSAEE AGHQLTTTPM SNGSVVVTVP 
VVSPTYAASP LQRVDLSLRL DDETYHRELK RLQAKLYLLG LQVYHQKRPV VIVFEGWDAA 
GKGGAIQRLT AELDPRAYIV HAIAAPTGDD KARHYLYRFW RRLPPRGQFA VFDRSWYGRV 
LVERVEGFAR PEEWRRAYAE INQFERQLVD FGTIIAKFWL HISPEEQLRR FEQRQNVPYK 
AWKLTDEDWR NREKWPAYLA AVDEMLLRTS TPFAPWTIVE AEDKKFARIK VLRTAVDVLE 
SELGVVKLE