Gene Cagg_2091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2091
Symbol
ID	7267598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2559512
End bp	2561545
Gene Length	2034 bp
Protein Length	677 aa
Translation table	11
GC content	55%
IMG OID	643566925
Product	glycogen branching enzyme
Protein accession	YP_002463414
Protein GI	219848981
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0296] 1,4-alpha-glucan branching enzyme
TIGRFAM ID	[TIGR01515] alpha-1,4-glucan:alpha-1,4-glucan 6-glycosyltransferase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGAAG GTGAGCAAAC CCGCCGCACC CGGCGTAAAC AAGCAACACC GGTCACCGAA 
GCGACGGCAC CGATGACCAC AGCAGAGGTT GAACATACGA CTACCGAAGG ACCTGAACCG 
TCGGCAGCTA CCACGGCGAT GATGAAGAGC ATTCTGAGTG AGGATGACAT TTATCTCTTC 
AATCAGGGCA CCCACTACCG GCTCTACAAC AAATTCGGCG CCCAGCCGGT GACGATTGAA 
GGCGTACCCG GTACCTATTT CGCAGTGTGG GCACCGAATG CTGAATACGT CGCCGTTATT 
GGCGACTGGA ACAATTGGGA CCCCGGCGCA CATCCGCTGC GCCAGCGAGG CTTTTCCGGT 
GTGTGGGAAG GGTTCATTCC CCACATCGGC AAAGGCATGC GCTACAAATT CCATATTGCC 
TCACGCTATT ATGGCTACCG CGAAGACAAG ACCGATCCCT TTGGCAGCTA TTTTGAAGTA 
GCACCGCAAA CGGCGGCTAT CATCTGGGAT CGGGAGTATA CGTGGTCGGA TCAGCAGTGG 
ATGAGCGAAC GCGGTCAGCG CCAGCGTCTC GATGCGCCGA TCTCGATCTA CGAGGTTCAC 
CTCGGTTCAT GGCGACGTAA GCCGGAGGAG GATAACCGCC CTCTCACCTA CCGGGAACTG 
GCCCACGAAC TGGTCGAGCA TGTGAAAGCA TGCGGCTTTA CTCACGTGGA GCTGCTACCG 
GTGACCGAAC ACCCCTTCTA CGGCTCGTGG GGCTACCAAT CGACCGGGAT GTTCGCACCA 
ACCAGCCGGT ATGGTACCCC GCAAGATTTT ATGTACTTTG TCGATTACCT GCACCAGCAC 
GGTATTGGTG TGATCCTCGA CTGGGTACCG AGCCACTTTC CAACCGATGG TCACGGACTG 
GCGTATTTCG ACGGCACGCA TCTCTACGAA CACGCCGATC CGCGCAAAGG TTATCATCCC 
GACTGGGGGA GCTACATCTA CAATTACGGT CGCAACGAGG TGCGTAGCTT TCTGATCAGT 
TCGGCCCTGT GCTGGCTCGA CAAGTTCCAT ATTGACGGTT TGCGCGTCGA TGCCGTTGCC 
AGTATGCTCT ATCTCGACTA CTCGCGGCGA CCCGGTGAGT GGATTCCGAA TGAATACGGC 
GGTAATGAAA ATCTGGAAGC GATTAGCTTC TTGCGTGAAC TGAACACCCA AATCTACAAG 
TATTATCCCG ACGTGCAAAC CATTGCCGAA GAGAGCACAG CGTGGCCAAT GGTTTCGCGC 
CCGGTCTATG TGGGTGGGTT AGGCTTTGGC TTCAAGTGGG ATATGGGGTG GATGCACGAC 
ACACTGCAAT ACTTCCGCCG CGATCCCATC TACCGTCGCT TCCACCACAA CGAGCTGACC 
TTCCGTGGCC TCTATATGTT TACCGAGAAC TACGTACTCC CGCTCTCGCA CGATGAAGTC 
GTTCACGGCA AGGGGTCGCT GCTCGATAAA ATGGCCGGCG ATGTTTGGCA GAAGTTCGCC 
AACTTACGCT TGCTCTACTC CTATATGTTT GCCCAACCCG GTAAGAAGCT GCTCTTCATG 
GGCGGTGAGT TTGGGCAATG GCGGGAATGG TCGCACGATA CGAGCCTCGA TTGGCATTTG 
CTGATGTTCC CTTCCCATCA AGGAATGCTT CGGCTCATCA GTGACCTCAA CCGACTTTAC 
CGCAGTGAAC CGGCTTTGCA CGAACTTGAC TGTGATCCGA AGGGGTTCGA GTGGATTGAC 
GCCAATGATG CCGATACCAG TGTGTATAGC TTTTTGCGCA AGAATCGGCA CGGCGAGACG 
ATTTTGGTGG TGCTGAATGC AACACCGGTA GTCCGCGAAG ACTACCGTGT CGGCGTACCG 
TTTGGTGGTT GGTGGCGAGA GTTACTGAAC AGCGATTCGG AATACTATTG GGGGAGTGGG 
CAAGGAAATG CCGGTGGTGT GATGGCTGAA GAACTACCAT CGCATGGACG GCCATTCTCG 
TTGCGCTTGC GCTTACCGCC GTTGGGAGCG TTGTACTTCA AGCATAGCGG ATAG

Protein sequence

MSEGEQTRRT RRKQATPVTE ATAPMTTAEV EHTTTEGPEP SAATTAMMKS ILSEDDIYLF 
NQGTHYRLYN KFGAQPVTIE GVPGTYFAVW APNAEYVAVI GDWNNWDPGA HPLRQRGFSG 
VWEGFIPHIG KGMRYKFHIA SRYYGYREDK TDPFGSYFEV APQTAAIIWD REYTWSDQQW 
MSERGQRQRL DAPISIYEVH LGSWRRKPEE DNRPLTYREL AHELVEHVKA CGFTHVELLP 
VTEHPFYGSW GYQSTGMFAP TSRYGTPQDF MYFVDYLHQH GIGVILDWVP SHFPTDGHGL 
AYFDGTHLYE HADPRKGYHP DWGSYIYNYG RNEVRSFLIS SALCWLDKFH IDGLRVDAVA 
SMLYLDYSRR PGEWIPNEYG GNENLEAISF LRELNTQIYK YYPDVQTIAE ESTAWPMVSR 
PVYVGGLGFG FKWDMGWMHD TLQYFRRDPI YRRFHHNELT FRGLYMFTEN YVLPLSHDEV 
VHGKGSLLDK MAGDVWQKFA NLRLLYSYMF AQPGKKLLFM GGEFGQWREW SHDTSLDWHL 
LMFPSHQGML RLISDLNRLY RSEPALHELD CDPKGFEWID ANDADTSVYS FLRKNRHGET 
ILVVLNATPV VREDYRVGVP FGGWWRELLN SDSEYYWGSG QGNAGGVMAE ELPSHGRPFS 
LRLRLPPLGA LYFKHSG