Gene Caci_5439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_5439
Symbol
ID	8336793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	6263981
End bp	6265015
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	75%
IMG OID	644958537
Product	HAD-superfamily hydrolase, subfamily IIA
Protein accession	YP_003116139
Protein GI	256394575
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0647] Predicted sugar phosphatases of the HAD superfamily
TIGRFAM ID	[TIGR01460] Haloacid Dehalogenase Superfamily Class (subfamily) IIA

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGCTG AGACCAACGA GGGCGCCGGC AACGGCGGAC CCGTGCCGTT CCTGACGTCC 
CAGAAGCCGC TCGCCGAGGC GTACGACACC GCGCTGCTGG ACCTGGACGG CGTGGTGTAC 
CGCGGCGCCG ACGCGGTGCC GCACGCCGCC GAGGCGCTGC GCGCCGCGCA GGAGCACGGC 
ATGCGGCGCA CCTACGTGAC CAACAACGCC TCGCGCACCC CGGAGGCCGT CGCCGAGCAC 
CTGAACGAGC TCGGCGTCGC CGCGGCGGCG CACGAGGTCG TCACCTCGGC CCAAGCCGCC 
GCGCGCATGG CGGTGGCCTG CGTCGGCGAG GGCGGCCGGG TCCTGGTGAT CGGCGGCGAC 
GGACTGCGGG CGGCGGTGCG CGAGCTGGGG CTGAAGGCGG TGGCCGGCGC CGACGACATG 
CCCGACATCG TGGTCCAGGG CTATTCGCCC GACCTCGGCT GGAAGGACCT GGCCGAGGCG 
ACGTACGCGG TGCGCCGCGG CGTGCCGTGG ATCGCCACCA ACACCGACAC CACGGTCCCG 
ACCGCGCGCG GTATCGCCCC GGGCAACGGC ACGCTGGTCG CCGCGGTCGG CGCCGCCTCG 
GGCAAGACCC CGCAGGTCGC GGGCAAGCCG GAGCTGCCGC TGCACCGCGA GTCGATCCTG 
CGCTCCGGCG CCACGCGGCC GCTGATCGTC GGCGACCGGC TGGACACCGA CATCGAGGGC 
GCGGTCCGCG GGAACACCGA CAGCCTGCTG GTCTTCACCG GCGTGACCAC GGCGCGCGAC 
CTGCTCGCCG CGCCGCCGGA CCGGCGCCCC AGCTACCTCG CCGAGGACCT GCGCGGGCTG 
CTGACCGCGC ACGTCGCGCC GACCCGCGAC GGGGTGAACT TCGTCTCGGC GCGCTGGACC 
GCCGCGGTGG TCTCCGAGCA GGTCGTGCTG CACGGGCACG GGGACAAGAT GGACGCGCTG 
CGGGCGATGT GCGCCGCGGT GTGGGAGTAC GGCCGCGAGG TCGACGTCGA GGACGCGCTG 
GCGAGTCTGG CTTAG

Protein sequence

MTAETNEGAG NGGPVPFLTS QKPLAEAYDT ALLDLDGVVY RGADAVPHAA EALRAAQEHG 
MRRTYVTNNA SRTPEAVAEH LNELGVAAAA HEVVTSAQAA ARMAVACVGE GGRVLVIGGD 
GLRAAVRELG LKAVAGADDM PDIVVQGYSP DLGWKDLAEA TYAVRRGVPW IATNTDTTVP 
TARGIAPGNG TLVAAVGAAS GKTPQVAGKP ELPLHRESIL RSGATRPLIV GDRLDTDIEG 
AVRGNTDSLL VFTGVTTARD LLAAPPDRRP SYLAEDLRGL LTAHVAPTRD GVNFVSARWT 
AAVVSEQVVL HGHGDKMDAL RAMCAAVWEY GREVDVEDAL ASLA