Gene Cagg_3609 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3609
Symbol
ID	7269753
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4384392
End bp	4385573
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	59%
IMG OID	643568416
Product	hypothetical protein
Protein accession	YP_002464882
Protein GI	219850449
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0518753
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.506408
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGATC GCGAGATGGT GCAACAGATT CGGTCTGAAT TGGGTGCATT GCAGCCGCCG 
GTTCTCTCGT TATACGTAGC GGTCAATCCG GCCAACCCTG AGAATGCCGG ACGAGCATGG 
GCGCTGCGGG CGCGCAACGC GGTAAAGGCG TTGGCGGCAC CGGCCGAAGT TGAGCAGGCA 
GTGCTGGCAG CGCTCGAAGC GGAGATGGTG CCCGAAGCGC ACACGTTAGC TCTCTTCGCG 
GCGGCGCCGG TGGCCGAAGC CAAAAGTTCG ACGGTGATGA TTACCCGCTT GCCGTTGCAT 
ATCGACCTAC CGTTGCTTGA TTTGACCAAC GGCCGGGTCG AGGCACGCTG GGGTGAGCCA 
TACATTGCAC CGATTGTGTA TGCACTCGAC CAGTACGAGC GCACCGCCGT TGTCTGGTTG 
CGTGGCGAGG GTTGGCGCTT CTTTGAGGTG TTCCTTGGCG AGATCGTTGA GTATACCGAT 
GTGTTCCGTA ATGTCGAGAG CGATCTGTGG CGTGAAGTTA GCGAATTCGA CCCACACCGT 
TTACGCGAGC GGTTGCGTAC ACAGGCGATG GGGAATCGCG ACCGCTTTGC GCGTCGGATG 
GAAAATATCG CCACTCGCTA TCTGCAACGG CTCGCCGAAC TGACCGAACG GGCTATGACT 
CATTTCGGTC TGCGCCGTTT GGTATTGCTC GGTCGTGAAG AGGCGACCAA GCAGTTTGCC 
GATCTCTTGC CGCGCACTGT CCGTCAGATG GTGATTGCTC ACGTGGCCGA TTTACCGCAT 
CCTGATGAGT CGCCTGCCCA TGTTCTCGCC AAAGTCTGGC CGATCCTTGA GCAGGTAGAA 
CAGGCGCACG AGCAAGAGTT GCTCGACCAG ATCACGCGCC AACCCGGTGT ATGGGGTGTC 
GATCCCACGT TGTCGATGTT GCAAGAGGGA CGATTGAGCG TATTGGTAGC TCCATGGCGT 
CTTAATACCG ACGTCTGGAT GACCGACGAT GGCTTGCTGG CCGGTAGTCG TGAGCAAGCT 
ATGCTGCTGA ACGCTGCCGG CGAACCGCAA TCGGTACCGC TCCGAGATGT GCTGGTTGAT 
ATCTGTGCAG CATACGCTAC GCGACTCGAG TTTGCCTCTG GACCGGCAGA GGAGCGGTTA 
CTCCGTGATC TGAATGGTTT GGCCGGTCTG TTGCGTTGGT GA

Protein sequence

MIDREMVQQI RSELGALQPP VLSLYVAVNP ANPENAGRAW ALRARNAVKA LAAPAEVEQA 
VLAALEAEMV PEAHTLALFA AAPVAEAKSS TVMITRLPLH IDLPLLDLTN GRVEARWGEP 
YIAPIVYALD QYERTAVVWL RGEGWRFFEV FLGEIVEYTD VFRNVESDLW REVSEFDPHR 
LRERLRTQAM GNRDRFARRM ENIATRYLQR LAELTERAMT HFGLRRLVLL GREEATKQFA 
DLLPRTVRQM VIAHVADLPH PDESPAHVLA KVWPILEQVE QAHEQELLDQ ITRQPGVWGV 
DPTLSMLQEG RLSVLVAPWR LNTDVWMTDD GLLAGSREQA MLLNAAGEPQ SVPLRDVLVD 
ICAAYATRLE FASGPAEERL LRDLNGLAGL LRW