Gene Cagg_0142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0142
Symbol
ID	7266881
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	189495
End bp	190985
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	56%
IMG OID	643565014
Product	O-antigen polymerase
Protein accession	YP_002461529
Protein GI	219847096
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0300218
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATTTAT TCACCGGTCA ACGATTAGAG CGATCTGTGT GGTTATGGCT AGCCGCGGCT 
GCCTTAGTTG GGGTTGGTAT TGCGCTCGTC CCACCACTCT TCGCCGTAAG CTGGCTCCTC 
GGTCTGGCCG CGCTCGGTTT GGCGGTGTGT GATCCGATTT GGCCGGTAGC GCTGGCCGTG 
CTCTCGGTAC CATTCCAGCA ATTGGTCACG CTGCCCGGTG GGCTGAGTGT GACCCAGTTC 
TGTTTCATCC TGGTGGCCCT TAGCTTCCTC TGGCAATTGT CCCAACGACG GTGGCCCTGG 
CCGGATATGC CGGGCATTGC TCTGGCCATT TTCCTTTGGA CACTCGCCGT GACCGCCGCT 
TTGACACCAC TTAGCCGCAG TGAGGGACTA AAAGAGACAC TCCGTTGGGG AACAGTACTC 
CTGATCTACC TTGCTGCAAT GAGTGCGCTG CAAGACCCTG ATCGAGTACA ATGGCGACGG 
GCCGTACTCG TTGCCTGTTT GCTTGCTGCC CCGGCGATAA CGGCGTTGAT CGGTATTGGT 
CAGCACCTGA CCGGAATCGG CCCGGCGAGT TTTGCCGTTG GAGACGGGCG GGTGCGCGCC 
TATGGCACGA TTGGTCAACC AAACTCGTTT GCCGGCTACC TGAATCAGGC GTGGCCGTTG 
GCAGCCGGTT TTGGCCTGGT GATGATCGTC ACACATCATT GGCACACCTG GCGCGACAGG 
TTGCGCTTAG GCATCGTCTT CATCACGGCG GGTAGCTTGA TCGGTGGGTT ACTGGCGAGC 
TTTTCGCGTG GCGGCTGGGT AGGAGCAGCA CTCGGTGCGA CGGTCATGAC GGTTGTGCTT 
GGCGCCTGGT ACGGACGACG GATGCTGCGA CAGAGCATAC CGGTTATCCT TGTGGCAGTA 
TTTGGGGGAA TGATCCTGGT GAATAGTGGG TTGCTACCGA CCGCGCTGAG TAGTCGGCTT 
ACATCCATTA TCGCCAATCT CCAGCCGTTC GATGTGCGTA ATGTTAACAT CACACCGGAC 
AACTTCGCAG TAGTCGAGCG AATGGCGCAC CTGCAAGCAG CGTGGAATAT GGTGCAAGAA 
CGGCCGCTAT TGGGAGTAGG ACCGGGAAAT TTCACCATCG CCTACGAACG GCTGGTGTAT 
AGTGGGCAAA CACCCACATG GATTAAACCA TGGTATGATT CTCGTGGTCA CGCTCACAAC 
TACTACCTGC ACATCGCTGC CGAAAGTGGT TTGATCGGAT TGAGTGCGTA TCTGCTCTTG 
CTAGGTAGCG TTTGGCGTAC TGCGGTGCGA GCAGTTCAAC AAGCGAACGA TTGGTTTACA 
CGCGGTATCG CACTGGGTGG CATAGGAGTA GTGAGCACAC TGAGCGGTCA CAATCTCTTT 
GAAAATCTGC ATGTTTTGAA TATGGGAGTG CAGTTTGCGG CAATCATTGC GCTTATCGCG 
ACCATCAATA CCGGTCGCAC TGAACTGCAC AGTTGCAACG AGGACCTATG A

Protein sequence

MYLFTGQRLE RSVWLWLAAA ALVGVGIALV PPLFAVSWLL GLAALGLAVC DPIWPVALAV 
LSVPFQQLVT LPGGLSVTQF CFILVALSFL WQLSQRRWPW PDMPGIALAI FLWTLAVTAA 
LTPLSRSEGL KETLRWGTVL LIYLAAMSAL QDPDRVQWRR AVLVACLLAA PAITALIGIG 
QHLTGIGPAS FAVGDGRVRA YGTIGQPNSF AGYLNQAWPL AAGFGLVMIV THHWHTWRDR 
LRLGIVFITA GSLIGGLLAS FSRGGWVGAA LGATVMTVVL GAWYGRRMLR QSIPVILVAV 
FGGMILVNSG LLPTALSSRL TSIIANLQPF DVRNVNITPD NFAVVERMAH LQAAWNMVQE 
RPLLGVGPGN FTIAYERLVY SGQTPTWIKP WYDSRGHAHN YYLHIAAESG LIGLSAYLLL 
LGSVWRTAVR AVQQANDWFT RGIALGGIGV VSTLSGHNLF ENLHVLNMGV QFAAIIALIA 
TINTGRTELH SCNEDL