Gene Caci_8502 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_8502
Symbol
ID	8339882
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	9861562
End bp	9863094
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	71%
IMG OID	644961589
Product	exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase
Protein accession	YP_003119166
Protein GI	256397602
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2148] Sugar transferases involved in lipopolysaccharide synthesis
TIGRFAM ID	[TIGR03025] exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.129361
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGAGA TTCCGTGGGG GGATTTCGGC ATGGCGGTCG GGTCAAGCTT GGAAAGTCCA 
GTCGTGCGGG TACACCTCGC ACGGCCCTGG GCGACGAGAT ATCTAAGGAG CGCCATCACG 
GCGCTCCTCC TAGCGATGGA CTGGACCTGC GCGACAGCGG CCACCTGGCT CGCCGTCCCG 
GTCCAGGACG ACTGGCCGGC GTTGGTCGCC GTGCCCGTCG CATGGGTCGG CGCCGCGGGC 
GCGCACCGGC TCTACGAACG GCGCCATGTA GGACCGGGGA CCGAGGAGTA TCACAGGATT 
CTGCGGGCCT GCCTGGCCGC GATGGCAGCG CTGTCGGCGC TGTGCGCGCT GGTGGCCCGC 
AACGACCGTT TGGTGCGCAG TGTTCTGGTC GCCGTGCCGA TCGCGGCGGT GGGCTCGCTT 
CTGGCCCGCA AGGCGTTCCG TTCGTTGCAG GCCCGGCACG CCGGGCTTGC TTCGCGTCCG 
GCGCTTCTGG TCGGCAGCTC CATTCAATGC TCGGCGATGG CGGCGATCCT GCGGCGCGAG 
CGTTCGGCGC TGCGCGCGGT CGCGGCGCTG AACGTCGCCG GACCGAGCCA GGGGACGGCG 
CCGCTGTCCC AGGCTTCGGG CTCGGTGCCG CCGACACCGC AGGACCCGCT GGACCCGTTG 
AACGTCGGCA CGCTGACCGC GCACGGCGGG CCCAGCGACG CCGAGCAGGT CGCAACGGCC 
CTGGAGGTGA CCGGCTGCGA GGTCGTGGTG CTGATGCCCG GTCCGCATCT GGGAGCGGCG 
GCGTTGAGCG CTCTGGGCTG GCGGCTGGCC AGCCTGGGCG TGGACATCCT GGTCGCCCCG 
TTCCTCACCG AGATCGCGCC GGCGCGGCTG GCGGTCCGGC GCGACGGCGG CGTCCCGCTG 
TTCCACGTCC GCGCGCCGCG GCTCTCGCGC GGCGCGCGGG TCCCGAAGGA GCTCGGCGAG 
CGGGTGATGG CGGCGATCGG CCTGCTGCTG CTGGCGCCGA TCTTCCTGGC GGTATCGCTG 
GCGGTGCTGC TCGGCGACGG GCGGCCGATC TACTTCCGGC AGACGCGGGT CGGGCTCAAC 
GGGGAGCACT TCGTCCTCTA CAAGTTCCGC ACCATGTCCA CCGGCGCGGC ACAGGCGAAG 
AAGGAACTCG CGCACCTGAA CGTCAACTCC GACGGTCTGC TGTTCAAGAT GCGGCGGGAC 
CCGCGGGTGA CGAAGGTCGG CGCGGTGCTG CGCCGGTACT CGCTGGACGA GCTGCCGCAG 
CTGCTCAACG TCGTGCGCGG CGACATGGCC CTGGTCGGGC CGCGTCCGCC GCTGCCGGAA 
GAGGCCGCCA AGTACAGCGA GGAGGTCCGG CGCCGGCTGC TGGTCAAGCC GGGCCTGACC 
GGGCTGTGGC AGGTGAGCGG ACGTTCCGAC CTGGCGTGGG CGGACGCGGT GCGGTTGGAC 
CTGGGATACG TCGAGAACTG GTCGCTGGGC CTGGACGCGG AGATCTTGCT CCGCACCGGC 
TCGGCGGTCG TCAAGGGCAA AGGAGCTTAC TGA

Protein sequence

MDEIPWGDFG MAVGSSLESP VVRVHLARPW ATRYLRSAIT ALLLAMDWTC ATAATWLAVP 
VQDDWPALVA VPVAWVGAAG AHRLYERRHV GPGTEEYHRI LRACLAAMAA LSALCALVAR 
NDRLVRSVLV AVPIAAVGSL LARKAFRSLQ ARHAGLASRP ALLVGSSIQC SAMAAILRRE 
RSALRAVAAL NVAGPSQGTA PLSQASGSVP PTPQDPLDPL NVGTLTAHGG PSDAEQVATA 
LEVTGCEVVV LMPGPHLGAA ALSALGWRLA SLGVDILVAP FLTEIAPARL AVRRDGGVPL 
FHVRAPRLSR GARVPKELGE RVMAAIGLLL LAPIFLAVSL AVLLGDGRPI YFRQTRVGLN 
GEHFVLYKFR TMSTGAAQAK KELAHLNVNS DGLLFKMRRD PRVTKVGAVL RRYSLDELPQ 
LLNVVRGDMA LVGPRPPLPE EAAKYSEEVR RRLLVKPGLT GLWQVSGRSD LAWADAVRLD 
LGYVENWSLG LDAEILLRTG SAVVKGKGAY