Gene Cagg_0758 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0758
Symbol
ID	7268077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	938889
End bp	940319
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	56%
IMG OID	643565609
Product	VWA containing CoxE family protein
Protein accession	YP_002462118
Protein GI	219847685
COG category	[R] General function prediction only
COG ID	[COG3552] Protein containing von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.38799
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCGAC GAATTACCGA GTTTATTGCC GGGTTACGCG CTGCCGGCGT GAGAATTAGT 
GTTGCCGAAT CGGCCGATGC GTTGCGGGCA ATTGAGCAGG CCGGCATCAG CGATCGGAAT 
GTCTTTCGTT TGGCGTTGCA GACGGCTCTG ATCAAGGAAC GACAAGACCA AGCCATCTTC 
AACGAACTCT TTCCGCTCTA CTTTGGCAAA GACTCGCCGC CGCCGCTGCA GCAGGCCGGC 
GGTGGTCAGC TCTCGCCCGA AGAGCAGCAG CAACTTATGC ATCAGTTGCA GCAGCTCCTT 
GCCCAGTTTC CCCCCGGCCC GCTGAGCCAG CTTTTTCAGA GTATGGTTAG TGGTCAACCG 
CTCAGTAATC AGCAGATTCG GGCGATGTTG GCCAACGTCT CGCCGCCTCA TCTGACCAAT 
CCGCGCTACC GCGATTGGAT GGCGCGACAG GCAATGCGTG AATTGCAGAT GAATCGGCTG 
CAGCAGATGT TGCGCCAATT GCTCGAACAG TTGCGCGCAC AAGGGATGCG CGAAGAGGCA 
CTGCGGGCGA TTGAACAAGC TGCCCGTGAG AATCTCGCGA CGCTCGAACA GCAGATTGGT 
CAGCAGGTTG CCCAACAGAT GCAAGAACAG GCCCAAGGTC AAGGGCCACG CCAGAGAAGG 
GGGCTGCCAA GTGAGCGTGA ATTGCTCGAT ATGCCGCTCG AACAGCTCGA TGAGAGTCTG 
TTGCCCGAAA TGCGTACCCT TGTGCGCAAA CTGGCTGCAC GTCTCCGGAC TCGACTGGCG 
TTACGTCAGC GTCGTGGAAA GACCGGTACG CTCGATGCGA AGGCCACCAT CCGCACTAAT 
CAGCGCTTCG GCGGCGTCCC GATGTTAGTA CGTCATCGCA AGCGTCATCT CAAGCCGAAG 
CTGGTCATTC TGTGCGATCG CAGCGTGAGT ACCCAGCACG TCATGTCGTG TATGCTGTTG 
ATGATCTACG CCCTGCACGA TCAGGTGAGC CGTACTCGCT CGTTTGCCTT CATCGACCGG 
CTGTACGACA TGTCGCACTA CTTTACCGAA TCACGCCCCG AACAGGCAAT CACACAAGTA 
TTGACCGAAA TTCGTCCTAC CCGCAGTTAT AGCACCGATC TCGGTAACGC TCTCGCCGAG 
TTCTGCCGCG ATCAACTGCA TCTGGTTGAT CGGCGTACAA CAGTGATCGT GCTTGGTGAT 
GGCCGTAACA ACGAGAATGA TCCGAATCTG CCGGCGTTTG AGCAGATTCG ACGGCGAGCG 
CGGCGGATTG TCTGGTTTGC AACTGAAGAA CGATGGAAGT GGGGTGTCTA CGATCCCGGT 
TCACTGAGCA GTGACATCTA CAAATATGCA CCGATGTGTG ATGCAATGCA TGAGGTGACG 
ACGCTACGTC AGTTGGCAAC CGCAATTGAC CGACTGTTTC TACATCCGTG A

Protein sequence

MDRRITEFIA GLRAAGVRIS VAESADALRA IEQAGISDRN VFRLALQTAL IKERQDQAIF 
NELFPLYFGK DSPPPLQQAG GGQLSPEEQQ QLMHQLQQLL AQFPPGPLSQ LFQSMVSGQP 
LSNQQIRAML ANVSPPHLTN PRYRDWMARQ AMRELQMNRL QQMLRQLLEQ LRAQGMREEA 
LRAIEQAARE NLATLEQQIG QQVAQQMQEQ AQGQGPRQRR GLPSERELLD MPLEQLDESL 
LPEMRTLVRK LAARLRTRLA LRQRRGKTGT LDAKATIRTN QRFGGVPMLV RHRKRHLKPK 
LVILCDRSVS TQHVMSCMLL MIYALHDQVS RTRSFAFIDR LYDMSHYFTE SRPEQAITQV 
LTEIRPTRSY STDLGNALAE FCRDQLHLVD RRTTVIVLGD GRNNENDPNL PAFEQIRRRA 
RRIVWFATEE RWKWGVYDPG SLSSDIYKYA PMCDAMHEVT TLRQLATAID RLFLHP