Gene Caci_3839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_3839
Symbol
ID	8335192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	4346506
End bp	4347936
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	67%
IMG OID	644956975
Product	protein of unknown function DUF1254
Protein accession	YP_003114578
Protein GI	256393014
COG category	[S] Function unknown
COG ID	[COG5361] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.190359
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.11168
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGCCT CCCGGCCTGA CGCTGTCGCT GATGCGGCGC CGCCGCTGGT GCGGCAGATC 
AACGACGGCA GGTGGCTGGA CCAGCGGGAG GCCGAGGAAC TGCGCTCCGA GTTGTTCTTC 
CACCGGGCGG TCCACGCATA TCTGACGATG CTCCCGGCGC TGAACGTTAT CGGGATGCGG 
GACGGGTCCG AGGGTGCGTT CGGTGCCGGG TATCACGTGC TGCCGGTGTG GAAGGACCGG 
ATGGACAGCA GGACGTGGGT GCCGACCCCG AACGCGGACG TCATCTACTC GATGGGCTAC 
CTGGACCTCG GGGAGACCGG GCCGTTGGTG GTGAACGCCC CGGCGAACGT GATCGGGATG 
TTCACTGACT TCTTCCAGCG CACCATCACC GACGTCGGCG CGATCGGGCC GGACCGGGCG 
CGCGGCGGGC TGTACCTGCT GCTGCCGCCC GGCTACGACG GCCATGTCCC GAACGGGTAC 
TTCACGTTCC GGTCCTCCAC GTTCAACGTG TTCCTGTTCT TCCGCACGAT CATGGGCAAG 
GGCGACGGCG GGCCGGATCC GTCGGTCGGC GCGGCCACGG CCGAGCGGAC CCGGATCTAT 
CCGCTGTGGG AGGAGGAGAA GGACGTCCTG CCGATGCAGT TCCCGAACGC GAGCGGCGTC 
CGGGTGAACA TGATGTACCC GACGGACTTC TCCTACTGGA CCATCTTGAA GGAGTTCGTC 
GACTTCGAGC CCGTCGGCGC GATCGTTCCG GAACTGCGCG GCGTGCTGGC CTCGATCGGC 
ATCGTCAAGG GCGAGCCGTT CGCCCCGAAC GCCTGGCAGC GCGAGCAGTT GGAACGTGCC 
GTCCGGGTCG CTCCGCGGAT GACGCTCGCC CTGGCCCAAC TCGGCCGGGA CGACCAGCGC 
AATCTCTACT ACACCGACCG GCAGTGGGAG CAGGCTTGGT GCGGCGGCAC CGCGGAGTGG 
ATGCAGGCCA GCTACCTGGA CATCAACGCC CGCTCACGGT TCTTCCAGTA CGCCTATTCC 
TCGGCCCCGG CGATGGTCGT GCATAGCACC GGCGCCGGCT CGAAATACCC GTACTCCGCC 
CGCGACGCCG ACGGGGCGTT CCTGGAGGGC GCGAAGACCT ACCGGCTGCA CCTGCCGCCG 
AACCCGCCGG CCGACCTGTT CTGGGCAGTG ACCGCCTACA ACATCACTGA CGGCACCATG 
CCCGAGACCG AGCAGCTGCT GCCGTCCACG AACAGCTACT ACGACATCCC CAAGAACGAT 
GACGAGTCGG TGGACGTCTG GTTCGGTCCG CGGAAGCCCG ACGGCGTCGC CGACCACGCT 
TTCATCCAGA CCGTGCCCGA CCGGAACTTC GTTGTGGCGC TGCGCCTGTA CGGCACGGCG 
CCGGCCTTCT ACGACCAGAC CTGGAAGCCG GACGACATCG TCAAGGCATG A

Protein sequence

MHASRPDAVA DAAPPLVRQI NDGRWLDQRE AEELRSELFF HRAVHAYLTM LPALNVIGMR 
DGSEGAFGAG YHVLPVWKDR MDSRTWVPTP NADVIYSMGY LDLGETGPLV VNAPANVIGM 
FTDFFQRTIT DVGAIGPDRA RGGLYLLLPP GYDGHVPNGY FTFRSSTFNV FLFFRTIMGK 
GDGGPDPSVG AATAERTRIY PLWEEEKDVL PMQFPNASGV RVNMMYPTDF SYWTILKEFV 
DFEPVGAIVP ELRGVLASIG IVKGEPFAPN AWQREQLERA VRVAPRMTLA LAQLGRDDQR 
NLYYTDRQWE QAWCGGTAEW MQASYLDINA RSRFFQYAYS SAPAMVVHST GAGSKYPYSA 
RDADGAFLEG AKTYRLHLPP NPPADLFWAV TAYNITDGTM PETEQLLPST NSYYDIPKND 
DESVDVWFGP RKPDGVADHA FIQTVPDRNF VVALRLYGTA PAFYDQTWKP DDIVKA