Gene Cagg_2198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2198
Symbol
ID	7266771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2692649
End bp	2694154
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	57%
IMG OID	643567029
Product	protein of unknown function DUF333
Protein accession	YP_002463517
Protein GI	219849084
COG category	[R] General function prediction only
COG ID	[COG3042] Putative hemolysin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAGCCA GCCTACATCG CACGCTTACG CTGGTCTTTG CCATTGTCTT GGTAGGTCTC 
AACACCGGCT GCGTCCCTGT TCCCAATTCA GCGCAACCCA CAACCATTGC ACCAACCACG 
ACAGCACTTC CGTCCCGACC ACCCACTGCA ACCCCGGTGC CAACCGCGAT GACCGGCCTC 
GCGAATCCGG CTTCGGTCTA TTGTAGTGAG CAGGGTGGTT ATCTTGAGAT GCGGACTACT 
GGTGATGGTG GGCAAATCGG GGTTTGCCTT TTTGCCGATA ACAGCCTCTG CGAAGAATGG 
GCATTCTACC GTGGTGAATG TCGCCCCGGT GAGCAGTATG ATTCGACGAC GATACGACCT 
GACCCGACCG GCATCCCCGC ACCGATCGGC GAGCTACTGG CACTCTTCCG AGCTAACCTA 
CCGGCAAATG CCTTCAACGA CCTGGCTGCT CAACCGGTAC CAACCACCGA CGGCAGTCAA 
CTCTGGATCG TCTACAGTAC CGGTATGCGC AATTTCGACC TTAACCCGCT TGTCCCGCAT 
ACGCTAGCAC TTTACACCTA CACCGATGGT CGCTGGCAAG AACGGGGACG AACTACGCTG 
AGTACAGAGT CATTCACCGA TGGACCAGAT TTTGTGGGGA GTGTACAACA AGTGCAGATC 
GCCCCTGGGC GCATCTGGTT GCAGATTGAA GGTGGGATCG GTGCGCACGG TGGCAGTTAT 
CATCTCCTGA GTTTCGACGG TACTGAGTTA CGAACCGAAG TGGCCGCCTT CTCGCCCTAC 
CCCGGTTTTG GTCATACCGA GGATCTCGAC GGCGATGGAG TCCGTGAGGT TGTCCTTAAT 
CGTTCCGAAC CGTACATCTT CTGTTATGCA TGCGGCGTCT ACTACCCGGC GTATCAGGTC 
TACCGATGGC AAGATGAACG CATGGTCGCA TTACAGATTA GTGACCTGAC AGATGGGCAA 
ACCGAACCAT TCGCCGATCT CAACCGGCAA GCGATCACCT CAGCGCAAGC CGATCTATGG 
GCCGATGCCT TAGCGGCGAT CAATGCAGCC GTCGCACAAG CCGGTACCGC CGATCCGACC 
ACGCAAGCTG GCACACTGCG GTGGAATCAG CGTCTGATCC AGATGACGCA TACAGCGCAC 
ATGAACGCAA TCGCTGAGAG TGCTTACCCG CTGCTCAACA AGGTGTTCGC CGGTGATTAC 
GACGGCGCTG TAGCCGAGAT GCGTGCGTAC CCGCCGCAAG CGATCTTCAA TGCCGAGTCG 
CCACTGATCG TCGGTACCGT CGCCGAAGGA TGGGTCGAGA CATTAAGTGA ATATGTGCGC 
ACCGAAGCTG AAAAAGCTGC CGGTGTCGCA CCCGAACGGG CTGCGATTTA CGTTATCTGG 
GCCTGGGGAC GTTTTCTCGC CGATCCAACC GACCCGGCCA TCGGTACCGA TCTGGAGCGT 
GCCGCCCAGT TGCAACCCGA TGACCCGTTC TTCACCGATA TCGCAGCGTG GTGGGCATCA 
CGGTAA

Protein sequence

MIASLHRTLT LVFAIVLVGL NTGCVPVPNS AQPTTIAPTT TALPSRPPTA TPVPTAMTGL 
ANPASVYCSE QGGYLEMRTT GDGGQIGVCL FADNSLCEEW AFYRGECRPG EQYDSTTIRP 
DPTGIPAPIG ELLALFRANL PANAFNDLAA QPVPTTDGSQ LWIVYSTGMR NFDLNPLVPH 
TLALYTYTDG RWQERGRTTL STESFTDGPD FVGSVQQVQI APGRIWLQIE GGIGAHGGSY 
HLLSFDGTEL RTEVAAFSPY PGFGHTEDLD GDGVREVVLN RSEPYIFCYA CGVYYPAYQV 
YRWQDERMVA LQISDLTDGQ TEPFADLNRQ AITSAQADLW ADALAAINAA VAQAGTADPT 
TQAGTLRWNQ RLIQMTHTAH MNAIAESAYP LLNKVFAGDY DGAVAEMRAY PPQAIFNAES 
PLIVGTVAEG WVETLSEYVR TEAEKAAGVA PERAAIYVIW AWGRFLADPT DPAIGTDLER 
AAQLQPDDPF FTDIAAWWAS R