Gene Cagg_1965 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1965
Symbol
ID	7268881
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2400585
End bp	2401976
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	52%
IMG OID	643566802
Product	polysaccharide biosynthesis protein
Protein accession	YP_002463295
Protein GI	219848862
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0295315
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACATC TCCTGGGTTT TATGCGTGTC ACAGATCTGC GTGATACGTC GTACAAGCCA 
TCATCGCTTT TGTACAGCAG CATTCATTCA TTTGCCACCA GTCTTCTTTC CGTCGTGATC 
GGCATGGTGA GCAGTATTGC GATCGCGCGG GGGTTTGGTC CGGCAGCGAA GGGAAGCGCC 
GATCTGATCA TGGCAACCGG AACATTGCTG GCAATGGTTT TCGGATTGTC GCTTCAGTCT 
GGAATCGTGT ATGTAGTGGC GCGCGGACGT GCAATCATCA GCGGGTTACT TGTGCGTCTC 
GCGCTCATTG CATTGCTCCA GACAGCGCTG GCAACGGTTA CTTTGGCTGG ATTGATGCAA 
ACGACGCTGG CTCCAGCTCT CATGCCGCTA GGAAGTGAGC GCTGGAGAGT GGTTGCCGTT 
GCGCTTCTTG TGCTTTGCAG CCTGTTAGCG GGACATTATC GCAATGTATT GATTGGCTTG 
CAAGAAATCC CGCGCGTCAA CATCATCGAT CTGTACGGAA AAATCTTAAC GTTCAGTGTG 
ATCTTTGCAC TCATATGCGC ATCTTGGCTT CAAGATCAAC AACTCACGGC TGAAGCACTT 
GTATGGGCGC AGGTCAGCGG TGCTATGGCG GTCGTGTTCC TATTGCTGTG GGCGCTCAGG 
CCGTGGCTGA CCGGTTCACT CCAGCAGGAG AGCGGCTTAT CCGAAGTCAT AACATACTCG 
GTCCCATCGT ATCTGGCAAA TATGGTCCAG TTTCTGAACT ATCGTTTTGA TATTTTCGTT 
GTCGGTTACT TTGTGGGGGT CAAAGGCGTT GGTCTATACT CGCTGGCTGT GGGTATTGCC 
CAGTTGTTAT GGCTGGTTTC TAGTGCAGCA TCACAGGTAT TGTATCCAAA TGTTGCCTCC 
TCTGAAGATC GCGTAAGCGT CTCACAACGA ACGGCGCGCA TGTCGCGCCT TTCACTGTGG 
CTGAGCATTT TTCTGTCTGG AGGATTAGCA TCAGGAGGCG ATATGCTGCT GCCGCTGATA 
TTTGGCACTG CATTTCGAGA GAGCGTGCCA GCGTTGATGT GGTTATTGCC GGGCGTGACG 
ATCTTTAGCA TCACCAATGT CATTGGATCG TACTTTGCCG GCATTGGCAA GCCGCATCTG 
AACTTCCTTG CTTCGCTGAT TGGTCTGGTT GTCACTATAG CACTGGATGT CGTTCTTATT 
CCATCGCTAG GGATTGTCGG AGCGGCGATT GCCAGCAGTA TGTCATATCT GGCGACTACC 
CTAGCGGTGG TTGCACTCTT CGCGCGCGAA GCGAGCATAT CCCCAATGCA TGCGCTGCTG 
GTAACAAGAG ATGATCTGAG CCTGATTGTT GCGACAGCAA GACGAATTCG AGGAGAGCAG 
CATGCATCGT AG

Protein sequence

MKHLLGFMRV TDLRDTSYKP SSLLYSSIHS FATSLLSVVI GMVSSIAIAR GFGPAAKGSA 
DLIMATGTLL AMVFGLSLQS GIVYVVARGR AIISGLLVRL ALIALLQTAL ATVTLAGLMQ 
TTLAPALMPL GSERWRVVAV ALLVLCSLLA GHYRNVLIGL QEIPRVNIID LYGKILTFSV 
IFALICASWL QDQQLTAEAL VWAQVSGAMA VVFLLLWALR PWLTGSLQQE SGLSEVITYS 
VPSYLANMVQ FLNYRFDIFV VGYFVGVKGV GLYSLAVGIA QLLWLVSSAA SQVLYPNVAS 
SEDRVSVSQR TARMSRLSLW LSIFLSGGLA SGGDMLLPLI FGTAFRESVP ALMWLLPGVT 
IFSITNVIGS YFAGIGKPHL NFLASLIGLV VTIALDVVLI PSLGIVGAAI ASSMSYLATT 
LAVVALFARE ASISPMHALL VTRDDLSLIV ATARRIRGEQ HAS