Gene Cagg_2074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2074
Symbol
ID	7269233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2538390
End bp	2539439
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	52%
IMG OID	643566909
Product	lipopolysaccharide biosynthesis protein
Protein accession	YP_002463398
Protein GI	219848965
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3206] Uncharacterized protein involved in exopolysaccharide biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCGCT TGATCATTCT GCGCTTACTA GAAAGCTTCT TCCGCCGGCC TTTGCTGAGT 
GTTGCACCTT TTGTGATCGG GGTGCTATTA GGTGCCGGCT ACATCTTACT CTCTCCACCA 
GAATTTTTGT CGAGTGGCAA GATTTATATT GAAAAAGATA GTCTCCTTGC GTCGCTCACC 
TCATCCAAAA GCGACGCTTC ATGGTGGGTA ACGCCGGCCC AAGCAACGAC GAACGAACTG 
TATGAGTTAC TCGCTACCAA CGCTTTTGTG CGGGCGGCGA TTCAGCAAAC CAAACTCGAA 
CCGTACATGT CCGGTGGGCC AGATGTCGTC TGGGAAACGT TTACCTTCTT CCGTGACACG 
ATTAGCATTA ACCCATTAGG CGATAAACTG GTTGAAATTC GCGCCACGAC CGACGATCCT 
GAACTATCAT ATCAGATGGT CGTAGCGACG ATGGATACCT ACTTGAAATG GAAGTTGAAC 
ACCGATTTTC AAGAGAGTGT CGCGGCCCAA AAGTTTTTTG AAGATCTGAT CGCTCCGTAT 
CAAGCCGACG TTGATCAGGC TCGTCAGGCA TTAATCGACT TTCTCAGTGC TAATCCCGAA 
CCGGTACGCG GCGATCGCCC GCCCGGTGAG CAGTTTCAAC TCGACCAATT ACGGGCAGCA 
CTGGCCCGCG CCGAAGAACG TCTGAGCACG GCCCAAGAGA ACGAAGAGAG CGCACGCTTG 
GCGTTGGTCA AGAACGAGAG CTTGATCCGG CAGACATACC AGATCGTTGA CCAGCCCGAA 
ATCCCGCTCA GAGCCGAATT CTCGATCACG ACGTTCGTCA AGAATATGAT CATTTTTGTC 
GTGATTGGTT TATTCCTTTC AGTGAGTTTG ATCGGTGGCG GTGCTCTCAT CGATCGCAGT 
CTGCGTTTTC CGATTGACGT GCGTAATAGT CTGAATCTGC CGCTGCTCGC AGTGGTACCG 
CTGAGTTGGG AACCGCTCAC ACCGACACCG ATTGCAACGA TCACAGAGAC TGACCAACCG 
ACACTGCAAG CTCAAGTACA GGTGAAATGA

Protein sequence

MVRLIILRLL ESFFRRPLLS VAPFVIGVLL GAGYILLSPP EFLSSGKIYI EKDSLLASLT 
SSKSDASWWV TPAQATTNEL YELLATNAFV RAAIQQTKLE PYMSGGPDVV WETFTFFRDT 
ISINPLGDKL VEIRATTDDP ELSYQMVVAT MDTYLKWKLN TDFQESVAAQ KFFEDLIAPY 
QADVDQARQA LIDFLSANPE PVRGDRPPGE QFQLDQLRAA LARAEERLST AQENEESARL 
ALVKNESLIR QTYQIVDQPE IPLRAEFSIT TFVKNMIIFV VIGLFLSVSL IGGGALIDRS 
LRFPIDVRNS LNLPLLAVVP LSWEPLTPTP IATITETDQP TLQAQVQVK