Gene Caci_8956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_8956
Symbol
ID	8340349
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	10368414
End bp	10369601
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	69%
IMG OID	644962046
Product	Cupin 4 family protein
Protein accession	YP_003119610
Protein GI	256398046
COG category	[S] Function unknown
COG ID	[COG2850] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.695323
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCACC GGCTCGTTTC CAACTTGGAG AAGGCCCTGG GATGGGACGG GCCGGCGGCC 
CTTGGCACCG AGGTGGCCCG CGGCCACATC GACGACCAGG ACCTGCTGAC CCGACTGCTC 
ACCCCCAACC ACCTGCTGGA ACTGGTCATG CGCCGCCACC TGGCCAACCC GCAGCTGCGG 
ATGTACCAGG ACGGCGCCGT CCTGCACCCC GCGGCGTTCC TGACCAACTT CGTCTCCCGC 
CGCCACCAGG CATCACGGCG CGCCGACATG GCCGCCGTCG GCCGGATTCT CAACGAGGGC 
GGCACCCTGA TCCTGGACAC CATCAACCAG TTCGACCCCA CCCTGGAAGT CGCCTGCCGC 
GCTCTGGGCT GGTGGACCGG AGAGCTGGTC TCGGTCAACG CCTACCTCGC CGTCGGCGAC 
ACCGCCGGGT TCTCCACCCA CTGGGACGAC CATGACGTAC TCGTCGTCCA GGTCGCCGGA 
CAGAAGTCCT GGGAGGTGCG CCCGGCCTCC CGGCCAGTGC CGATGTACCG CGACGCCGAG 
CAGAACCTGG AGGCTCCCGA AGAGCTGCTG TGGTCCGGAA CCATGAACAC CGGCGACGTC 
ATGCACATCC CGCGCGGATT CTGGCACGCC GCCACCCGCG TCGGCTCCGG CGAGGGCATC 
TCCCTGCATT TGACCTTCGG TATCACCCGC CGTACCGGCG TCACCTGGGT CCAGCACCTG 
GCCGACGCCG CCCGCGACGT CGAGCTGTTC CGCACCGACC TGGAGAACCC GGCAGGCGCG 
GACGCCAAGC TGCTGACTAC CAAGCTGCTG GACCTGGCCG TCGACGTGAA CCCGCAGCGC 
TACCTGCAAC AGATGCGCGA GGCGACGCCG GCCGCCCGCC ACATCCCCCA CGTGCCGGCC 
TTCGGGCCGC TGGGCGGGGC GGTGACGGTG ACCGAGTACG CCCCGACCAT CATCGCCCGC 
GAAGCCAACC TTGAGGTCCG CGCGGCCGGC AAGAAGCTCA CCTTGTCACC TCGCGCCGAG 
GGCTGGGCCA GAACCCTGCT GTCCGGCAAC CCCATCCGCT TCGACGACAC CACCGACCCG 
GGCGCGATCG CTCTGGCCGA ACGCTTCATC CAGGAGGGCC TATGCGCGCC GCTGACCGAC 
GTCTCATCCT CGGGCTATAC CGGACTCGTG CCGACCGAGA CGTTCTGA

Protein sequence

MDHRLVSNLE KALGWDGPAA LGTEVARGHI DDQDLLTRLL TPNHLLELVM RRHLANPQLR 
MYQDGAVLHP AAFLTNFVSR RHQASRRADM AAVGRILNEG GTLILDTINQ FDPTLEVACR 
ALGWWTGELV SVNAYLAVGD TAGFSTHWDD HDVLVVQVAG QKSWEVRPAS RPVPMYRDAE 
QNLEAPEELL WSGTMNTGDV MHIPRGFWHA ATRVGSGEGI SLHLTFGITR RTGVTWVQHL 
ADAARDVELF RTDLENPAGA DAKLLTTKLL DLAVDVNPQR YLQQMREATP AARHIPHVPA 
FGPLGGAVTV TEYAPTIIAR EANLEVRAAG KKLTLSPRAE GWARTLLSGN PIRFDDTTDP 
GAIALAERFI QEGLCAPLTD VSSSGYTGLV PTETF