Gene Cagg_0830 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0830
Symbol
ID	7268282
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1032275
End bp	1033744
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	53%
IMG OID	643565680
Product	exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase
Protein accession	YP_002462189
Protein GI	219847756
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2148] Sugar transferases involved in lipopolysaccharide synthesis
TIGRFAM ID	[TIGR03022] Undecaprenyl-phosphate galactose phosphotransferase, WbaP [TIGR03025] exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.691353
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTTGA CCAGCGTCGA ACTAAAAGCT AACAGTTCTG AGCGGATCGG ATGGCAATTC 
CATCGTCTCG CCTTAATCGG TGCGCTCATA GTCGGTGATG CCTTCATCGT GACCGTTAGT 
TTTGTACTTG CCTATGTCGT GCGATTTTTG ATCAATCTAC CCTTCTTTAA CGAAGGTGCG 
ATGCAGCCGG AATTTTATAC GCTGCTGATT ATGATGTTGG TCCCATGCTG GAGCGCACTG 
TTTGCCGTAT ATCACCTCTA CGATGACAAG CTGTTGTTCA ACGGCACCCA AGAGTACCAA 
CAAATTACCA ACGCTACGAG CATGGGTATG CTCATTGTCG TTCTCCTCAC CTTCTTCTGG 
GACAACCTTG TGGTAGCGCG CGGTTGGTTG CTCCTCAGTT GGTTCCTCTC GCTGAGTCTG 
ATGACCCTGT GGCGCTTCGG TGTTCGTCGG TTTGTTTACC GACTGCGGAA ACACGGTCAC 
TTGCACAAAC GAGTCCTGAT TATCGGCGCC ACTGAGGAGG GTCAGGCAAT TGCCGAGCAG 
CTTTTGGCCG AGAAACGCGC CGGTGCAACT ATCGTTGGCT TTATCGATAA CACGCTACCG 
GTGGGCAGCA ATGTAGGGCA TGGTAAGGTG AAGGTTCTAG GTACCACCGG TGATTTTACC 
CAATTGGTCC AACAGAACAA CATTGAGGCA ATCATTATTG CCGATACAAA CCTGATCCGT 
GAGCAGCTCA TTACCATCAA CGGTGCAATG GATGTGCTCA GCCGATTGGA GGTTATGCTC 
GCCCCTGGCC TTTTCGATCT CTTAACCATT GGGGTACAGG TCCGCGAGCA GGGTGCGGTG 
CCACTGCTCA GCCTGAACAA AACGCGCATT ACCGGACTGC ACGCCATCGG TAAAAAGATC 
GTCGACGTGG TGGGCGCGTT GGTAGGCCTG ATTCTACTGT CTCCACTCTT GATCTGCGTC 
GCGATTGCCA TCAAATTGGA TAGTCCGGGT CCGATCATCT ACCGGCGGCG CGTTATTGGG 
GTCGGCTATC GTGAGTTTTC CGCCTTTAAG TTTCGCACGA TGTACATCGA TGGCGACCGG 
CGACTAACAC CAGAACAACG CGCCGAGTTG GCCCAGAAGG GAAAATTGAT CGACGATCCG 
CGGATTACGC GCGTGGGCAA GTGGCTGCGG CGCACGAGTA TCGATGAATT ACCGCAACTC 
CTCAATGTCT TGCTCGGCCA GATGAGCCTT GTCGGACCAC GAATGATCAC CGCCGGCGAG 
ATGCATCATT TTGGGCGTTG GCAGCACAAT CTGCTCACGG TCCGACCCGG TTTAACCGGC 
CTCTGGCAGA TCAGTGGGCG AAGCAATCTT GGCTACGCCG ACCGTGTGCG ACTCGATATG 
CACTACATCC GCAACTATTC GATCTGGCTC GATCTATTCA TTATCTACCG TACTATCCCG 
GTCTTGCTGA AGGGAGAAGG CGCCTACTAG

Protein sequence

MSLTSVELKA NSSERIGWQF HRLALIGALI VGDAFIVTVS FVLAYVVRFL INLPFFNEGA 
MQPEFYTLLI MMLVPCWSAL FAVYHLYDDK LLFNGTQEYQ QITNATSMGM LIVVLLTFFW 
DNLVVARGWL LLSWFLSLSL MTLWRFGVRR FVYRLRKHGH LHKRVLIIGA TEEGQAIAEQ 
LLAEKRAGAT IVGFIDNTLP VGSNVGHGKV KVLGTTGDFT QLVQQNNIEA IIIADTNLIR 
EQLITINGAM DVLSRLEVML APGLFDLLTI GVQVREQGAV PLLSLNKTRI TGLHAIGKKI 
VDVVGALVGL ILLSPLLICV AIAIKLDSPG PIIYRRRVIG VGYREFSAFK FRTMYIDGDR 
RLTPEQRAEL AQKGKLIDDP RITRVGKWLR RTSIDELPQL LNVLLGQMSL VGPRMITAGE 
MHHFGRWQHN LLTVRPGLTG LWQISGRSNL GYADRVRLDM HYIRNYSIWL DLFIIYRTIP 
VLLKGEGAY