Gene Cagg_0802 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0802
Symbol
ID	7268121
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	996622
End bp	998034
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	52%
IMG OID	643565653
Product	O-antigen polymerase
Protein accession	YP_002462162
Protein GI	219847729
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTTCTT TGCTGTACGC TTTTGAAGCA CCACCGTGGC TGCGACGACT GCCACAACCG 
CTGCTTGTGG GCGGAGTGAT CGGTTGGCTA GCAGTGTATA GCCTCGCGAT CGGGGTGATG 
TTCGGCAGCA ATCGCACGTT GATCGGATTG GCCCTATTGG CATTACCGTT TGGGCTGATT 
GGTCTTACCT TACTGCTCTA CCGATTCGAG TGGTTTGTGT TGATCTTGCC ATTGACCGCA 
CTTGCGATGC GACCGGTGGC GTTGCCGGCC GGTAATAATA GCCATTTGCC GATCAGTATG 
CTGCTTACCC TCGCGTTGTG CGGCATTTGG GTGTTGGCAA TGATCAAACG ACGCACGTGG 
CAACTAACAC CTTCACCGCT CAACAAGCCA CTGCTCGCCT TGATGGGCTG TTTCATCTTC 
TCGACCATCT GGGGCACAAT CTGGGCCGAT CCGATCCTTG ATTGGTGGAT TATGGGCAAT 
TTTCGCTTGG CCCAATTCGC TTCACTGCTC TCTTTTCTTG GCTTGCTCGC CACACCGTTA 
CTGATTGGGC GTTTCATTCG GTTTAAATGG CAGATCAAAG CCTATCTGGC AATGTTCATC 
ATTTGCGGCA GCCTGATGAC TGTCGCTCAG ACGTTCGGTA TCGATCAAAT TATGTTAAAC 
GATGCCGGCC TATGGGGGCT TTGGTTTGCG CTTCCACTTG CCGGAGTCAC CTATCTCCAA 
CCACGGCTAC ACTGGCGATG GCGGTTGGCG GGTAGTGTAC TACTCCTCTG GCACTTGTGG 
CTGGCTGCCA TTCGCAATTC ACTTTGGATT TCGGGTTGGC TACCAACTAT CATCGGCCTT 
GTTGTTATGA CCTTTCTTAT ATCACGACGT ATCTTTTTCG TTCTCGTCCT TATTATTGCT 
ATCAATCTGG CGATTGGGCC TGGCAGACAC TACATCGACC AAGTGGTCAA CGAGAACATT 
GAAGAGGGAG GGTTGGGTCG GCTCGAAATC TGGCAACGCA ATCTCTCGAT CGTCCAGCAA 
CACTGGCTTT TTGGGATGGG AGTTGCCGGG TATGCACCGT ACAACATGAC CTATTTTCGT 
TACGATGCTC GTTCGACCCA CAACAATTAC TTCGATATTC TGGCTCAATT TGGTGTCATC 
GGCTTTGGCC TCTGGCTCTG GTTCACCATT GTTAGTATCC GGTACGGTTG GCGTACCATT 
GCGCTTGCAC CACCGGGCAT TTTACACACC ACCGCCATTG TGGCCATCGC CGGTTGGATA 
GCAGCTCAGT TCTCGATGAT GCTCGGTGAT TGGATTTTAC CGTTTCTCTA CAACCAGACC 
GTCGCCGGTT ATGCATATAC CGTCTATAGC TGGATATTCC TCGGCTTACT GATTAGTGTG 
CGACAGTTGG TGCAGAAAGA GCCATTGTCA TGA

Protein sequence

MRSLLYAFEA PPWLRRLPQP LLVGGVIGWL AVYSLAIGVM FGSNRTLIGL ALLALPFGLI 
GLTLLLYRFE WFVLILPLTA LAMRPVALPA GNNSHLPISM LLTLALCGIW VLAMIKRRTW 
QLTPSPLNKP LLALMGCFIF STIWGTIWAD PILDWWIMGN FRLAQFASLL SFLGLLATPL 
LIGRFIRFKW QIKAYLAMFI ICGSLMTVAQ TFGIDQIMLN DAGLWGLWFA LPLAGVTYLQ 
PRLHWRWRLA GSVLLLWHLW LAAIRNSLWI SGWLPTIIGL VVMTFLISRR IFFVLVLIIA 
INLAIGPGRH YIDQVVNENI EEGGLGRLEI WQRNLSIVQQ HWLFGMGVAG YAPYNMTYFR 
YDARSTHNNY FDILAQFGVI GFGLWLWFTI VSIRYGWRTI ALAPPGILHT TAIVAIAGWI 
AAQFSMMLGD WILPFLYNQT VAGYAYTVYS WIFLGLLISV RQLVQKEPLS