Gene Cagg_2072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2072
Symbol
ID	7269231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2536189
End bp	2537430
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	52%
IMG OID	643566907
Product	hypothetical protein
Protein accession	YP_002463396
Protein GI	219848963
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGATGGG GGGTCGTTAT CCTACTTATG GTTGGTTTGC TCAGTAGTGT AGCCATCACA 
CAACCTGTAC AAGCAGCAAT TACCAATATC GGGGCCGGTG GCTGCCCGGT GAATACTATC 
GTGGGCGGCG ATAATGTGGT CCAGAACGGC AATTTTGCCC AGGGTGCGGT CGGCTTCACC 
TCACAACTGA TCAATCGCGG TGACGGTGTC TATCCTGATG ACAACAACGG TGGCGGTTTT 
TCGATTCAGA TTGGAACGAT AGTGTATCCT CCATTTGAAA CTAACCCCTA TATCTACGGA 
CGGTCATTTC CCGGTGATCC ACAACGTGAT GTACCGCCTA CCGACACCTA TTTTTATTCA 
AACCCAAGTG CAGCCAACTA TCAGGCAGGT AATGGCCGCG TCAACTTGTG GACGCAAACG 
GTAGCAGTTG CTCCCAACAC GACGTACAAC TTCTTTGCCT ATTTCGACAA TCTCCTCGAC 
CCGGTGAAGA GTGCGAACGG TGCTGCCGAT CCGATCATCG AATTGCGGGT CAACAATACC 
TCAGTTGGCA CGACCGTGAT CCCCAAAACG CCAGATCGTT GGGTGCCGGT GCAGTATGCC 
TTTACGACCG GTGATAATGT CACGAGTATC ACTTTGAAAA TCGATAGCCT CACCAATAAC 
ACATTTGGTG ACGATTTTGC AATGACGCAG ATCAATCTCA AACAATGCGT CAGTGGGGTG 
GGCGTCGCCA AATTTGCCTT CCCGCCCGAA GCTGCTACCC ACAACGGTGT AGAAGGGTTT 
CGGCTTGAGT ATTGGATCAC CATCCGGAAC TTAGGTGCTG ATCCGGTGAC CAATCTGGCC 
GCTATCGATG ATCTGGCTAC CGTTTTTGCG GCTGCTGAAG ATTGGGATGT GCTCGAACTC 
AGTGCCATTA ATGAGAGTGG GTTTACCGTG TTGACGGTAA ATCCCGCGTT CGATGGAAGT 
AGTGATCGCA ATCTTCTCGC TACCAATCAG AGTCTTGGTC CTGGTCAAAG CGCACGGATA 
CGGTTGGTTG TGTGGGTCAA CCCCCCGGAA GGTCCGACCG TATTTACCAA CAGCGTCCAA 
CTATCGGCGC TGTCAGGGAA CGTAGTAGTC ACCGATCTAT CAATGCCCGG TCTCAATCCC 
GATCCCAACG GTAATGGTGA CCCCAAAGAA GACGGCGAGA TCGGAGTTAC CGTCTCAATC 
TTCTCACCGT ACCAAACATG GGTACCGATA GTGACCCGCT AG

Protein sequence

MRWGVVILLM VGLLSSVAIT QPVQAAITNI GAGGCPVNTI VGGDNVVQNG NFAQGAVGFT 
SQLINRGDGV YPDDNNGGGF SIQIGTIVYP PFETNPYIYG RSFPGDPQRD VPPTDTYFYS 
NPSAANYQAG NGRVNLWTQT VAVAPNTTYN FFAYFDNLLD PVKSANGAAD PIIELRVNNT 
SVGTTVIPKT PDRWVPVQYA FTTGDNVTSI TLKIDSLTNN TFGDDFAMTQ INLKQCVSGV 
GVAKFAFPPE AATHNGVEGF RLEYWITIRN LGADPVTNLA AIDDLATVFA AAEDWDVLEL 
SAINESGFTV LTVNPAFDGS SDRNLLATNQ SLGPGQSARI RLVVWVNPPE GPTVFTNSVQ 
LSALSGNVVV TDLSMPGLNP DPNGNGDPKE DGEIGVTVSI FSPYQTWVPI VTR