Gene Caci_0044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_0044
Symbol
ID	8331369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	45480
End bp	46550
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	70%
IMG OID	644953211
Product	Rhomboid family protein
Protein accession	YP_003110840
Protein GI	256389276
COG category	[R] General function prediction only
COG ID	[COG0705] Uncharacterized membrane protein (homolog of Drosophila rhomboid)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCAG GCAGCCCAGG CAGCCCCTCC GTGCCAGCCA CCGAACTCCC GGCGTGCTAC 
CGGCATCCGG GCCGCGAGGC GCAGATCCGC TGCACCCGCT GCGATCGCCG GATCTGCCCG 
GAGTGCATGG TCCCGGCCTC GGTCGGGTTC CAGTGCCCGG AGTGCGTGCG CGGCGGCAAC 
CAGGAGGTGC GCAAGGCGCG GTCCCCGTTC GGGGCGGTGC TGCGCCCCCG GGTGGTCCCG 
GTCGTCACCT ACAGCCTGAT CGCGCTGAAC TTCGTGATGT TCGGCCTGCA GCACATCGTC 
GGCACCTCGC AGGTCGGCGC GGCCGGCGGC GGGGTGTTCC AGGTGAACAC CCTGGACATG 
CGGCTGGAGC TGATCGCCAA GGGCACCTGG GTCGACGGCC AGCCGATAGG CGTGGCCAAC 
GGCGAGTGGT ACCGCCTGGT CACCTCGATG TTCCTGCACG CGAACCTGAT CCACATCGCC 
TCGAACATGA TCTCGCTGTT CTTCATCGGC CCGATGCTGG AGGCGATGCT CGGCCGGCTG 
CGGTTCGTGC TGGTCTACCT GATCGGCGGC CTGGCCGGGG CGGTCACGTC CTACTGGTTC 
ATGACCCCGC TGAGCCCGGC GAGCCTGGGC GCCTCGGGCG CCATCTCGGC GGTCTTCGGC 
TGCCTGGTGG TGATCGGGCT GCGGCGCAAG ATCCTGGACC CCGGGATGAT CGCCGTGGTG 
CTGGTGATCA ACATCGTGAT CCCGCTGCAG AACACCAACA TCGACTGGCG CGACCATGTC 
GGCGGCGTGG TGGCCGGGGC GCTGATCGGC GCGGTCTACG CCTTCGCCCC GGAGCTCATC 
GGCGCGCTCG GCAAGGCCAG GGCGCCACGC GAGCAGCAGG TACGGCTGCT CAACTGGCTC 
GGCTTCGGCA CGATGGCGCT GGTCCTGGCC CTGGCGATCG GCGGCACGGC CGTGCACACC 
GCCCACCTGA ACGACCCGGC GAACCGGACG CGCACCGTCG ACGGCGCCGT GTACTCACCC 
GGCCCGACCA GGGTCGTCAC CGACGTTCCG ACAAGTTATC CACAGGCCTG A

Protein sequence

MPPGSPGSPS VPATELPACY RHPGREAQIR CTRCDRRICP ECMVPASVGF QCPECVRGGN 
QEVRKARSPF GAVLRPRVVP VVTYSLIALN FVMFGLQHIV GTSQVGAAGG GVFQVNTLDM 
RLELIAKGTW VDGQPIGVAN GEWYRLVTSM FLHANLIHIA SNMISLFFIG PMLEAMLGRL 
RFVLVYLIGG LAGAVTSYWF MTPLSPASLG ASGAISAVFG CLVVIGLRRK ILDPGMIAVV 
LVINIVIPLQ NTNIDWRDHV GGVVAGALIG AVYAFAPELI GALGKARAPR EQQVRLLNWL 
GFGTMALVLA LAIGGTAVHT AHLNDPANRT RTVDGAVYSP GPTRVVTDVP TSYPQA