Gene Caci_1037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_1037
Symbol
ID	8332372
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	1178717
End bp	1179832
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	68%
IMG OID	644954185
Product	hypothetical protein
Protein accession	YP_003111804
Protein GI	256390240
COG category	[S] Function unknown
COG ID	[COG4427] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.314959
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0209911
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCG ATGACTTCCG TAGGTTCGCG ACGACGGCGG CCGGGACCTC GCCGCTGTAC 
GCCGCGCTGG CCGAGCAGGT TGCCGATGAT GGGCGGCTGC GGGAGGTGTC TGAGGCCGCT 
GGCGATCCGT CGGTGGCGTT GTTCTTCGCT GCTGTGCAGC GGGTGCTGGC TGACCGTGGG 
GACCATCCGT TGGCTGCCTA CTACCCGTCG TTCGGCGGCG ACCGCGCGCC GGATGCGGAG 
CTGGCGGAGG CCTTTGAGGG CTTCGTGGTG GGACATCGTG ATCGGCTTGA GGCGTTGCTG 
GTGACGGGAC ACGTCCAGAG CAACGAACCG TTGCGGGCCG CGCAGTTGCG GCCGGCGTTC 
GGCTGGGCCC AGGCCGGGCT CGGGCGTGCG TTGGGTCTGA TCGAGGTCGG GACCAGTGCG 
GGGCTCTTGT TGTATCCGGA GCGCTATGGC TACGTATACG AGTTCGGCGA CGGCTCGGTG 
CTGGAACGGC TGCCCGCAGC GGATCCTGAC CAGCGCGACG ATGTTCCGGG ACCGGTGCTG 
CGGTGTCTGG TGCGCGGCGC GGCGACTGCG AAGACGCTTG CCCCGTTCGT CAGCAAGGAG 
CTGCGCGTTT CTTCGCGTGT CGGTATCGAC CTGAATCCGT TGAAGCCGGC CGATGCCGAG 
ACCAGAGCGT GGCTGCGCGC GCAGGTCTGG CCGGAGGAAG CCGATCGCCT GGCGCGTTTG 
GACGCGGCCC TGGCCATGGC GGCCCGGTAT CCGTTGCGGC TGCGCCAGGG CGATGTGCTC 
GACATCCTTC CGGCGGCGAT CGGGATGGTG GCGGCTCCGT CCGTGCCGTG CGTCTTTCTC 
TCCAACACGC TGGCGCACCT CACTGCCGAG GCTCGCACCT CGTTCGTCGA GATCATCAGG 
GCCCTGGGAT CGAGTCGAGA TCTGGTGCTG ATCCTGAAGG AACCTGATGC GGTGGGCTTG 
GGGCTGTTCG TTGAGCGGCC GGGCGGGGAT CCGTCTGCGG CGCGGGCCGA CTCGTTGGGT 
GCCGTCCTCT ACCAGTCGGG TCGTGAGCGG TCCTTCTTGC TCGGCACGGC CGGATCGCGA 
GGCGACTGGC TGGACTGGTC GCCTGCCATG CTCTGA

Protein sequence

MSADDFRRFA TTAAGTSPLY AALAEQVADD GRLREVSEAA GDPSVALFFA AVQRVLADRG 
DHPLAAYYPS FGGDRAPDAE LAEAFEGFVV GHRDRLEALL VTGHVQSNEP LRAAQLRPAF 
GWAQAGLGRA LGLIEVGTSA GLLLYPERYG YVYEFGDGSV LERLPAADPD QRDDVPGPVL 
RCLVRGAATA KTLAPFVSKE LRVSSRVGID LNPLKPADAE TRAWLRAQVW PEEADRLARL 
DAALAMAARY PLRLRQGDVL DILPAAIGMV AAPSVPCVFL SNTLAHLTAE ARTSFVEIIR 
ALGSSRDLVL ILKEPDAVGL GLFVERPGGD PSAARADSLG AVLYQSGRER SFLLGTAGSR 
GDWLDWSPAM L