Gene Cagg_3687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3687
Symbol
ID	7268222
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4481727
End bp	4483478
Gene Length	1752 bp
Protein Length	583 aa
Translation table	11
GC content	55%
IMG OID	643568493
Product	hypothetical protein
Protein accession	YP_002464959
Protein GI	219850526
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTACAC CCGATCCGTT CTCGTTACCG CCCGTTTCGT CTACCGAACC ACGACGCAGT 
CCATTGTTCC TGATCATCGG CGGTTTAGTC ATCGGTGGAT TACTGATCAT CGTCGGTGGT 
GGTGCGTTGG TATGGAGCAT GATCAACCAG CGTGGTAGTG CCATTCCTGA ATTATTACCG 
GCTGAAACCC AAATCTACGC TGCGATCACG CCCAATCTGA GCGATCTGCC GAATATTGAC 
CGTTTACGAC GAGCCTTTCC CGAAACCTTC GACTACCAGA ACACCGACCA AACGAGCGAT 
TTTTTGCAAG AACGCTTTGG TGTAACGTTT GCCGATGACA TCGCGCCGTG GATAGGTGCT 
GAAGTAGCGG TCGCCGTCTA CGGCTTGCCG ATCGAGCAGC TAAGTGCAGT CGTCGGCGAA 
TTGTCCAATC CATTCAATCC GCCGGCAACA CTCAACCCGC TAGAAGATGC TGATTTACGC 
AACACCAATG TGCTGTTGAT CGTAGCAGTT CGTGATCAAC GGGCCGCCCA GGCTTTTCTC 
GACAAACAGC GCACGTTTCG AGAGGCGCAG GGTGAGCGTT TTACGAACAG CACAACGAAT 
GGGGTGACGA TCTACGAAAG TGAGAGTGAT GAAACGGCGT TTGCTGCCTT CGCACTGGCC 
CGCAATATGG TCGTCTTTGC CAACAATGCC ACGAGCATCT CTACGCTGAT CGAGCAACGT 
AGCGAGACCG CACTGGCCCG TAGCGCACAA TTTCAAGCCG TGAGCCAGCG CTTGCCGACT 
GACCGGATTG GCACGATCTA TCTTGCCGGA GATGGATTGG CTCGTTTTAT TGACAGCCTC 
TTTGCATCAG GCTCACTCGA TGAGACCGTG CCAATGCTGG CCGATATGCA ATCGGCAGCC 
CAAGCTATGC AAGGAGTCGG CTTCACAATG GCCGTTATCG AGAGCGGTCT GCGCTTCGAT 
GCAGTGACCG TCTTTGATCG CAACCGGCTG AGTAATGCAC TGCGCGAGCA ACTCGGTAGC 
CTGCGCCCAA CCGTCTCGCC CGAACGAGCC GGTGATGTCA GCAGCACCGC GATCGGTGTA 
TTCAGTTTTG GCATACCTGC CGATTGGGGG CAGCGTCTCC GTGATCAGTT AGAGGCCGAA 
CCTGAAACTG CCAATGCGCT GCGTGATCTC GAAGACAGTC TCAACATCAG TCTCGACCGC 
GACTTGTTTA GCTGGTTTCA CGGTGAAGGG GTGATCGCGC TGTTGCCTAT CGATAGTGTC 
GAATTGCCGG TAGGAGGCTA CTTCGCGCTG CGTGTTGCCG ATCGGTCGGC TGCCGAGCGA 
GGTATGCAAC GGCTCATTGA ATTGGCCGAA GACCTTACCG GTATCCGGAC CGGTACAACC 
TCGCTGGGGC GCACGCAAGT GCAAGCGTTT GAAGAGGGCG ATCTCTTCTT TGGGTACGGC 
TTCAACGGCA ACGATCTGGT GATTGCAGTG GGTCGACCGG CGATGGAAGC TGCCTTTGGC 
GTCGAACAAA AACTGTCAAG TGTGGCGACC TATGCGAATG CGTTGAAGGC GATGCCCTCT 
CCCAATGGTG GTGTCCTGTA TATCAACCTT ACCGCAGCCC GCAGGTGGTT TAACCAGACA 
AATGATCCGA TTGACCCCGA ACTTGAGCAG CGGTTGGCTC CATTCACTGC TATCACGAGC 
AGTGGCACGG TCGGGATCGA TGATCGTGGG GTAATGCGTG GTACGCTGCT GTTAAGTATT 
GAACCGCAAT GA

Protein sequence

MTTPDPFSLP PVSSTEPRRS PLFLIIGGLV IGGLLIIVGG GALVWSMINQ RGSAIPELLP 
AETQIYAAIT PNLSDLPNID RLRRAFPETF DYQNTDQTSD FLQERFGVTF ADDIAPWIGA 
EVAVAVYGLP IEQLSAVVGE LSNPFNPPAT LNPLEDADLR NTNVLLIVAV RDQRAAQAFL 
DKQRTFREAQ GERFTNSTTN GVTIYESESD ETAFAAFALA RNMVVFANNA TSISTLIEQR 
SETALARSAQ FQAVSQRLPT DRIGTIYLAG DGLARFIDSL FASGSLDETV PMLADMQSAA 
QAMQGVGFTM AVIESGLRFD AVTVFDRNRL SNALREQLGS LRPTVSPERA GDVSSTAIGV 
FSFGIPADWG QRLRDQLEAE PETANALRDL EDSLNISLDR DLFSWFHGEG VIALLPIDSV 
ELPVGGYFAL RVADRSAAER GMQRLIELAE DLTGIRTGTT SLGRTQVQAF EEGDLFFGYG 
FNGNDLVIAV GRPAMEAAFG VEQKLSSVAT YANALKAMPS PNGGVLYINL TAARRWFNQT 
NDPIDPELEQ RLAPFTAITS SGTVGIDDRG VMRGTLLLSI EPQ