Gene Cagg_0803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0803
Symbol
ID	7268122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	998031
End bp	999677
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	53%
IMG OID	643565654
Product	glycosyl hydrolase BNR repeat-containing glycosyl hydrolase
Protein accession	YP_002462163
Protein GI	219847730
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGTC GGCTCAGCGC ATTCCTTGCC CTGATCTGCT ACCTGATCGG CTTCAACGTT 
ACACAACTAT CACACGGCCA GAGTATCTGG TCGTTACCGA TTGAGTTGTC ACCGCTGCAA 
TACGGCCAAC GACCGCTTGA GCAACTCGAA CGACCGTATG GCTGGTCATG GTTGCCCGAT 
ATGACACTCG GCCCTGACGG TAGCGTGCAT GTGGTATGGT ACGGGGGCCT GATTAAGGAC 
CAAGGTAATG AAGGTACGGT TGATCTATTG ATGTATCGCC GTCGTAACGC CGATGGCTCG 
TGGGAGCCGG TGCGTGAATT GTTCGCACCA GGCGAAGGTG GTTACACGGT TCGCACGAGC 
ATAACCCTTG GGCGCGACGG GAATCTCCAT CTCCTTTACC GAGCCGGAAC ACGCATCTTG 
TACACGAACG CGAACTGGCG TGGCGCCATC CAACCACATG CGTGGCAACC TGAGAGGGTA 
ATCAGCGATA GTGGTTACTA TGTTGCGCTC GCCGCCGATC AGACCGGAGG GTTGCACGCT 
TTTTGGAGTG ATATTGTTAC CGAGAACACC AACCCACACT GTTATCGGTG TGGTGAACTC 
TTTTACCGAC GCTCGACCGA CAATGGTGTC ACGTGGTCAC CGGTTGTTAA TCTCTCGCGT 
ACCGACGAAG GTGATAATCG TCCACAGGTA CGGATTGATA GGTTCAACCG TATTCACATT 
GTTTGGGATG TCGGGGCCGA TTGGTACGCC GGGCAAGGAC AACCCCACTA TGGTATGTAC 
CGACGTTCGG ATGATGGGGG GCTGACATGG AGCGAACCGG TGCGATTCAG CTTACCACCG 
GCTGTGGTAC AAGAAATTCG CCAGCAGCAA AATCAGGTGA CGACAGGCAA TGATGCGCAG 
AAACCGCCTT TTGAGGCGGT CCAGCAGACG GCATTGGCGG TTGATGAAGC CGGTAATCCA 
TTTGTCGTCT ATCGTGGCGT CCACAACGAT CGTCTCTACT TTCAGCGTTC GCTCGATGGA 
GGCAATACGT GGACACCGGC GAGTGAGCTG CCCTATGTGC GGGCGCGTAA TATCACCGAC 
AATAACCTTG ATTATTACAG TCTTGCGGCT GATAGCGCCA ATAACATCCA TTTATTAATG 
GTGGGGTTTG TAGGAACCAG CACGACCGAT ACCCCACCGG CCCTGATTCA TATGACGTTC 
GACGGCACAC GATGGTTATC GCCGCGAATC GTGATGCAGA ACGAGCTATA CCCTGAATTG 
CCACGACTGG CGATCTACAA TGGCAATCAA CTGCACGCTG TCTGGTTTAC GCGGTCGAGT 
TTGTTTGAAG CTAAGAAGTC GAATAAACGG CCGGTCTATC AAATTTGGTA TAGCACTGCA 
CAACTCAACC TACCGGCCCA ACCCGGTATT CCGCTCTTTA CTCCAACACC GGTCACAACC 
ACACCAACCG CTGTGGCCGG CGTTGTAGTT ATGCCAACGG CCACCCCTAT TGTGTTACCC 
GATGAGATAC GTCACGCACC TGCCTTGCAA GAACCAATGC GCTGGGAGTT GTATGGTTTA 
CAGGCGATCG GTATTGCTTT GATATTGACC ATCATCGGTA TTGGCGTCAT CGGTGGACTA 
ATCATGATCA GGCGGTCACA CCGATAG

Protein sequence

MKRRLSAFLA LICYLIGFNV TQLSHGQSIW SLPIELSPLQ YGQRPLEQLE RPYGWSWLPD 
MTLGPDGSVH VVWYGGLIKD QGNEGTVDLL MYRRRNADGS WEPVRELFAP GEGGYTVRTS 
ITLGRDGNLH LLYRAGTRIL YTNANWRGAI QPHAWQPERV ISDSGYYVAL AADQTGGLHA 
FWSDIVTENT NPHCYRCGEL FYRRSTDNGV TWSPVVNLSR TDEGDNRPQV RIDRFNRIHI 
VWDVGADWYA GQGQPHYGMY RRSDDGGLTW SEPVRFSLPP AVVQEIRQQQ NQVTTGNDAQ 
KPPFEAVQQT ALAVDEAGNP FVVYRGVHND RLYFQRSLDG GNTWTPASEL PYVRARNITD 
NNLDYYSLAA DSANNIHLLM VGFVGTSTTD TPPALIHMTF DGTRWLSPRI VMQNELYPEL 
PRLAIYNGNQ LHAVWFTRSS LFEAKKSNKR PVYQIWYSTA QLNLPAQPGI PLFTPTPVTT 
TPTAVAGVVV MPTATPIVLP DEIRHAPALQ EPMRWELYGL QAIGIALILT IIGIGVIGGL 
IMIRRSHR