Gene Caci_1789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_1789
Symbol
ID	8333132
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	2026708
End bp	2028045
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	71%
IMG OID	644954939
Product	protein of unknown function DUF1501
Protein accession	YP_003112551
Protein GI	256390987
COG category	[S] Function unknown
COG ID	[COG4102] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACACAG TGACCCGCCG CCGCTTCCTG GAGTTGTCCG GTGTCATGTC CACCGGCGCG 
TTCGCGGCCG CCTGCTCCTC CTCGCACGGC CACCCCGTCG GCGCCCCCGC GCTGACCCCG 
AGCGGCCCGC AGACCTCCGG CGCGCAGCTC GGCGCGGCAG CGCAGCACGC GCCGCTGGCC 
GCCGGTCAGG GCGTGCTGGT GCTGGTGACG CTCTACGGCG GCAACGACGG CCTCAACACC 
GTGATCCCGT ACGCCGACAA GGCCTACGCC GCCTCCCGCC CCGACCTCGC CTACAGTGCG 
AGCCAGGTCC TCGACCTCGG CGACGGCCTC GGCTTCAACC CGGCGATGAC CGGCCTGCAC 
CAGATGTGGC AGCGCAAGCT GTGCGCGGTG GTGCGCGGTG TCGGCTACCC GCAGCCCAAC 
CACAGCCACT TCGTCTCGAT GGACATCTGG CAGACCGCCA CGCCGGGGGA GCCCGCCAAC 
TCCGGCTGGC TCGGCCGCTG GCTGGACGCC CAGCCCGACG ACCAGATCAG GGCCCTGAAG 
GCGATCTCCG TCGGCGGCAC GCTCCCGCCG CTGCTCGGCG GGACCAAGAC CGCCGGCAGC 
TCGCTGCCGA TCGGGCAGTT CCACCTGCCC AAGGCCGGAC CGCTGGACAC CGGGTTCCAG 
GGCTTGGGGA AGCAGTCGGC GCAGGACTCC GCGGTCACCG CCTACGCCGC CCGCGACGTC 
GCCGACCTGT TCACCGTCGC CAAGACCTTC ACCCCGGCGC TCGCGTCGGC GGCGAACTCG 
GCGGGAAGCA CTGCGGGGAG CACAACAGCG AACAGCAAGA GCGCCGCCAA GGCGGCGGCC 
AAGCCCGCCA AGGCCGGCAA AGGCTCAGCA CTGGCTCAAC AGCTGGACAT CGTCGCCGAA 
TGCATCAACG CCTCCGTCCC GACCCGGGTC TACAGCGTCA GCCTCGGCGG CTTCGACACG 
CACAGCGCCG AGAAGGGCAC GCAGTCGGAC CTGTGGGGCG AGGTCGACAA GGCGGTCGTG 
GACTTCCAGA ACGCCATCGC CTCCGGACCC CACGGCAAGA ACGTGGTCAC CATGCTGTAC 
ACCGAGTTCG GCCGCCGCGT GCACGCCAAC GCCAACGAGG GCACCGACCA CGGCACCGCG 
GGCCCGGTCC TGCTGCTCGG CGAGCCGGTG AACGGCGGCT TCTACGGCGA GCAGCCCTCG 
CTGACCGACC TGGACGACGG CGACCTGAAG TTCGGCACTG ACTTCCGCAG CGTCTACGCC 
ACGCTGCTGG ACAAGGTGCT CGGCGCCGAC CCCGCGCAGA TCCTCGGTGC GGACCAGCCG 
CGTATCGCGT TCCTGTGA

Protein sequence

MDTVTRRRFL ELSGVMSTGA FAAACSSSHG HPVGAPALTP SGPQTSGAQL GAAAQHAPLA 
AGQGVLVLVT LYGGNDGLNT VIPYADKAYA ASRPDLAYSA SQVLDLGDGL GFNPAMTGLH 
QMWQRKLCAV VRGVGYPQPN HSHFVSMDIW QTATPGEPAN SGWLGRWLDA QPDDQIRALK 
AISVGGTLPP LLGGTKTAGS SLPIGQFHLP KAGPLDTGFQ GLGKQSAQDS AVTAYAARDV 
ADLFTVAKTF TPALASAANS AGSTAGSTTA NSKSAAKAAA KPAKAGKGSA LAQQLDIVAE 
CINASVPTRV YSVSLGGFDT HSAEKGTQSD LWGEVDKAVV DFQNAIASGP HGKNVVTMLY 
TEFGRRVHAN ANEGTDHGTA GPVLLLGEPV NGGFYGEQPS LTDLDDGDLK FGTDFRSVYA 
TLLDKVLGAD PAQILGADQP RIAFL