Gene Caci_4970 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4970
Symbol
ID	8336324
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	5682962
End bp	5683948
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	68%
IMG OID	644958069
Product	Rieske (2Fe-2S) domain protein
Protein accession	YP_003115671
Protein GI	256394107
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.22227
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.214971
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCGTG AGGTGACCGG CGCGAGTGCC GAACCACATC AGCACCCGTG GGGCTGGTAT 
CCCGTCGCGT TCAGCCGTGA AGTGACGTCC GGCAAGGTCA TCAGCCGGAA GTTCGCCGAG 
TCCGAGATCG TCATCTACCG GACCGAGACC GGCCGGGCCC ACATCGTCAG CCCCTACTGC 
CCGCATCTGG GTGCTCACAT GGGCGGCGCC CGCGTCGACC GCGAGTTGCT GGTGTGCCCC 
TTCCACGCTT TCGCCTTCGC GCCCGACGGC CGCTGTGTCC GCACCGGATA CGGCACGCCG 
CCACCCCGCG GCGCACAGCT CACCTCGACG CCGGTCCGCG AAAGGAACGG TTTCATCTTC 
GCCTGGCACC ATCAGAACGG GTCCCCGCCG TCCTGGGAGG TCGAGCCGTT CGACTTCAGC 
GGATGCGGCC GAGGCGCGGT CTGGTCTCGC ACGTTCCAGG GAAACCAGAT CGACTTCCTG 
GAGAACACCG CGGACATCGG GCACTTCTCC ACCCTGCACC ACGTCCAGGC GACGCTCGTG 
GGCACGCCGC GCATGGACGG CCACCGCTAC GCCACCGACA TCGACCTGTC CGGCTTCTAT 
CGCAGCGAGC TGGTCACCCA CGCCCACGTG GAAGTGTTCG GCCTCGGATA CGTCACCGTG 
CGCTTCGACA TGCCGAAGCT CGGCATCAGC GCCATCGAGT TCGCCGGACT CACTCCGGAA 
GGCGGCGGCG CCATGACGCT GCGTCGCATC ACCCACGGAC GCCTCGCCGG CACTCGACTG 
CCGCGCGCGG CAGCCTGGGC CCGGCGTCCG GCCTCCGATC TCCTGGGCTT CGCGCTGAAG 
GTGGCGGGCA ACTCTCAGGT CACGGCCGAT GTGCGCATGT GGAGTCGCCG TGTCGTCACC 
GAGACTCCCA AGCTCGCCCA AGGCGACGGT CCCATCGCCC CCGCCCGCCG CTGGGCTCAG 
CGGTTCTACC AGGAACAGGA AGCGTGA

Protein sequence

MTREVTGASA EPHQHPWGWY PVAFSREVTS GKVISRKFAE SEIVIYRTET GRAHIVSPYC 
PHLGAHMGGA RVDRELLVCP FHAFAFAPDG RCVRTGYGTP PPRGAQLTST PVRERNGFIF 
AWHHQNGSPP SWEVEPFDFS GCGRGAVWSR TFQGNQIDFL ENTADIGHFS TLHHVQATLV 
GTPRMDGHRY ATDIDLSGFY RSELVTHAHV EVFGLGYVTV RFDMPKLGIS AIEFAGLTPE 
GGGAMTLRRI THGRLAGTRL PRAAAWARRP ASDLLGFALK VAGNSQVTAD VRMWSRRVVT 
ETPKLAQGDG PIAPARRWAQ RFYQEQEA