Gene Caci_8509 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_8509
Symbol
ID	8339889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	9868421
End bp	9869542
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	70%
IMG OID	644961596
Product	glycosyl transferase group 1
Protein accession	YP_003119173
Protein GI	256397609
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0326575
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGTCGG CGGGCTGGTT CCCGCCCTAC CTGGAGGAGG TCGCCGAACA GGCGGAGGCG 
GGGACGCGCT CGAAGGTGTG GCTCTACGAC CTGCCCTACG ACCTGACGGT TCTGGACCAG 
CGCTTCGTGA CCGGCCCGTC GAAGGTACGC AGGCTGATAT ACGGCAGGCT GCCGTTGCCG 
CTGGCCTTCG CGGCGGAAGC CTTCCGCGTG CGCAAGAAGT ACGACGCGAT CTTCGCCTGG 
GGCGCCGAGG CGGCGAGCCT GCCGCTGGCG TTGGCGTTCC GGTTCACCCC GCGTCGGAAG 
CGGGCGCCGC TCGTCACGCT GTACAGCTGG ATCTCCTCCG GCATGAAGGC GAAGCTGCTG 
CGCTTCGCGT GGCCGGGTAT CACGACGCTC GTCCTGCCGC CGACGGCGCA GGCGGAGTTC 
GCGGTCAAGC AGCTCGGGGT GCCGGCGGAG CGGGTCACGT CGCCGAAGTG GGTCGTGGAC 
ACGGAGTTCT TCAACCCGGA CTTGGTGAAG CCCGAAGCGG TGGACGTCAC GGCCGTCGCG 
GAGGACGCAG ACGACGCAGA CGGTCCAGAC CACGGCGCCG TGACGATCTG CTCCGCCGGT 
CGGGAGATGC GCGACTTCGC GACGCTGATC GCCGCCCTCG ACGGGACCGG GATCCGTTGC 
CACATCGCGG GTTCGCTGGT GGCGGGGATG GATGACCGCT GGCGTGCCGA GCTCGGCGAT 
CGCGGCGAGC GGGTCGCGCT GCCGGAGGGC GTCACCTTCG GGCCGCTGAC GCCGATCGAG 
ATGCGCGAGC TGTACGCGCG CTCGCGGTTC GTGGTGCTTC CGCTGCATCC CAGCGACACG 
GATCACGGCA TCAGCTGCAT GATCGAGGCT TTCGCGATGG GTCGTGCGGT GGTCTGTACC 
CGCGTCGACG GGCAGCGGGA TGCGCTGGAG GAGGGCGTGA ACGGTGCCTT CGTGCCGGCG 
CATGACGCGG CGGCGTTGCG TGCGCAGATT CTGGAGCTGA TCGCCGATCC GGAGCGGGCT 
GAGGCGATGG GGCGTGAGGC ACGTCGGCTG GCTGAGGCGG AGTTCGGGAT GGACCGGTGG 
GTCTCGGCGC TGACGGAGGT GCTTGATGCA GTCGTCAGCT GA

Protein sequence

MVSAGWFPPY LEEVAEQAEA GTRSKVWLYD LPYDLTVLDQ RFVTGPSKVR RLIYGRLPLP 
LAFAAEAFRV RKKYDAIFAW GAEAASLPLA LAFRFTPRRK RAPLVTLYSW ISSGMKAKLL 
RFAWPGITTL VLPPTAQAEF AVKQLGVPAE RVTSPKWVVD TEFFNPDLVK PEAVDVTAVA 
EDADDADGPD HGAVTICSAG REMRDFATLI AALDGTGIRC HIAGSLVAGM DDRWRAELGD 
RGERVALPEG VTFGPLTPIE MRELYARSRF VVLPLHPSDT DHGISCMIEA FAMGRAVVCT 
RVDGQRDALE EGVNGAFVPA HDAAALRAQI LELIADPERA EAMGREARRL AEAEFGMDRW 
VSALTEVLDA VVS