Gene Cagg_1670 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1670
Symbol
ID	7268972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2038013
End bp	2039899
Gene Length	1887 bp
Protein Length	628 aa
Translation table	11
GC content	54%
IMG OID	643566512
Product	hypothetical protein
Protein accession	YP_002463007
Protein GI	219848574
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGCAC GCCTTTACCT CATAGTTATA CTGGTACTCA CGTTGGTACC AATCAGCGCG 
GCTGCCCAAC AACCATCGCC AATCAGCATC ACCGTACAGG TAGGACTTGA CGGCGAGGGA 
AGTTTTCGGC CCAAATACTG GGTACCGGTC TTCGTCACAC TTGCCAATGA CGGGCCAGAC 
CAGCAGATCA AGCTCGAATG GCGCGACCAG AACACAGGGT CTTTCACCCA AAGCTATGTG 
CTTGATCTAC CCGGCGGTGC GCGCAAGCAG ATCGTGTTAC CGGTTATCCA AACCTCTCGT 
AGCGCAATCT TGACTGCGAC GGCAAACGGC GTACAGGTGT TTCGCGAACG GATTTTCCTC 
AAGCAACTGC CTGATGATCA GATAGCAATC GGCTTGCTAA GTACCGATCC CACTGTGTTG 
AGTAGCTTGA CGATTGCCGA TTTCGGAGCG ACTCGCGGCG CCACGATTAT CCCACTGACA 
CCGGCGTTGC TGGTCGATAA CCCGCTGCTG CTGACGGCAA TTGATGTGAT CGCCGTGCGC 
GAACTCACCG CCGAACTACG TCCAGAACAG CGGGAGGCTC TGATCACATG GGTGCAACAG 
GGCGGCACCT TGCTGATCGG CGGTGGAGCA GTCGGCGAAA CGGCCATCCG CACCTTTGCC 
GATATGCTCC CGGTCACCGT TGGGCCGCTC CAAGGGAATT GGCCGGTCAA CACTTTAGCA 
CAGCTTATCG GTTTGAGTGG GTTAAGCAAC AGCGTCCCCC AACTTACGGC ACATACCGTC 
ACGTTACGGG CAAATGCCCA TGCACTGACC AATGATACGC TGATTAGCCA GATGGAGCTA 
GGAGCGGGAA AAATCATCTT CGCCGCGTTC GATCTTGCCA CATTGCGGGC CTGGCCGGGT 
GAGGCCAAAC TGTGGGCGAA GGTTCTCGCG CTTCAACCCC GGATTGACAT CGGGGCAACG 
TTCCGTTTTA GTTTTAACGA TCTGCTACAA AGTAGTTTGA ATCAACCACT GTTTGAGCTA 
CCATCAACGA TGGTGATGCT CGGCCTTATC AGCTTGTACA TTATCGTGAT CGGGCCGCTT 
CACTTCTTCA TTTTACGTCA ACTACGTCGG CTCGAATGGG CATGGCTGAC CACACCACTG 
CTGATCGTTA TCTTTCTGCT CGGCACTTAT GGCATGAGCT TCGCCCTTCG TGGTACCCAA 
ACGCAGATCG TTCAACTCAC CATTGTACAA ACCACGGCTA AAAGTGAGAC GGCCATCACA 
ACAACGTTTG CCGGCATATT TTCCCCACAG CGGAGCCGTT ATACGCTGAC TGTCACCGAT 
ACGGCCTTCG TTACCCCAAT GCGTACCGAT GTCGGGCCGG TTGAGACACA ACGCGACGAC 
AACGCAGTGA CCATCCCCGA CCTTCAACTC GATGCGTCAG CATTTCAGAC ATGGATCGCC 
GAGGAAGGAG GACCCAATCC GGTACAGATC GGTGCGCAAA TCACGCGCGA GGGCCAGGCT 
TGGAATGGAA GTGTAACCAA TATCGGCGAA TTCCCACTCC GCGATGTCAT GGTGGTCTGG 
CAGAACAATA TGCAATGGAT CGGTGACTTG CCAGCCGGCG CTGAGGCAAC GATCACCCTC 
AACCCTAATC AAGGTAATTT CCTACGCGAA TTCATCCCCA ACGATCAGAA TAGTTTACTG 
AACCACACGT TTGTGCTAGA GAACTTGTTT TGGTATAGTC AGACAACGAA CCGATTTACA 
CCACCTAACG AACCACCTAG CATGCCCGAT ACCAGGATGT ACCTGATCGG CTGGAGTGAG 
CAAGTGACGC CGGTATTCCA GATCGACGGT GTCGCGACCC GGACCCGTGG TGAGACGTTG 
TATATCGTGG CCCTACAGCA ACCGTGA

Protein sequence

MRARLYLIVI LVLTLVPISA AAQQPSPISI TVQVGLDGEG SFRPKYWVPV FVTLANDGPD 
QQIKLEWRDQ NTGSFTQSYV LDLPGGARKQ IVLPVIQTSR SAILTATANG VQVFRERIFL 
KQLPDDQIAI GLLSTDPTVL SSLTIADFGA TRGATIIPLT PALLVDNPLL LTAIDVIAVR 
ELTAELRPEQ REALITWVQQ GGTLLIGGGA VGETAIRTFA DMLPVTVGPL QGNWPVNTLA 
QLIGLSGLSN SVPQLTAHTV TLRANAHALT NDTLISQMEL GAGKIIFAAF DLATLRAWPG 
EAKLWAKVLA LQPRIDIGAT FRFSFNDLLQ SSLNQPLFEL PSTMVMLGLI SLYIIVIGPL 
HFFILRQLRR LEWAWLTTPL LIVIFLLGTY GMSFALRGTQ TQIVQLTIVQ TTAKSETAIT 
TTFAGIFSPQ RSRYTLTVTD TAFVTPMRTD VGPVETQRDD NAVTIPDLQL DASAFQTWIA 
EEGGPNPVQI GAQITREGQA WNGSVTNIGE FPLRDVMVVW QNNMQWIGDL PAGAEATITL 
NPNQGNFLRE FIPNDQNSLL NHTFVLENLF WYSQTTNRFT PPNEPPSMPD TRMYLIGWSE 
QVTPVFQIDG VATRTRGETL YIVALQQP