Gene Caci_4253 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4253
Symbol
ID	8335607
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	4828475
End bp	4829554
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	70%
IMG OID	644957356
Product	Membrane dipeptidase
Protein accession	YP_003114958
Protein GI	256393394
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2355] Zn-dependent dipeptidase, microsomal dipeptidase homolog
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.655109
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.32173
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAACAA CTGAAGGCCT CGACGCCTCG ACGCTGGAGC TGCACCGGCG CGTGGTGGTT 
GCCGATACCC ACAATGACCT GCTCTGCTCG GTCGTGCTGC GGCCGGTGGC GCAGTGGTCC 
GATTACTTCC GCGCGCAATG GTTGCCGCAG TTGCGGGCCG GCGGCGTGGA CGTTCAGGTG 
CTGCCGGTGT TCATCGATGA CTCCTTCCGT CCTGAAGGTG CTCTGCGCCA GACGTTGCGG 
ATGATCGAGG CGGCGCACCG GATTGCCGAG GGCAACGCCG ATGAGGTCAG CCTGTGCCTG 
GATGGCGCCG ACATCGATCG CGCCCTGGAC GCCGGGCGGA TCGCGCTGGT CCTCGCGCTG 
GAAAGCGCAC CTGGCATCGA CGCCGACATC GAACTGCTCA CCACCTTGTA CCGCCTCGGT 
GTCCGCATCG CCTCCCTAGC GCACTTCGGG CGCACGCCGC TCGCTGACGG CTCGGCGGAG 
GACGCGGCCG GGAGCCGGCT CACCGCTGCC GGCGTCGAGG CGTTCGCGGA GATGGAACGC 
ATGGGCATGG TGTTCGACGT CTCCCACCTC GGTGCGGCGG GCGTGGACCA TGTCCTGGAG 
TTGGCGACCC GGCCGCTGCT CGCCACGCAT TCCTCCGCTC GCGCGCTGTG CGACCACCAC 
CGCAACCTCA CCGACGCGCG CCTGGCGGCC ATCGCGGCCG GTGGCGGCGT GGTCTGCGTG 
AACTTCTTTC CCGGCTTCGT CGATGCCCAC GAGCCCTCCG TGTCCCGCCT CGTCGACCAC 
ATCGAGCACA TCGGCAAGGT CGCCGGTACC GACCATGTCG GCATCGGGCC GGACTTCGTC 
GTCGAGGTGC TGCGCGACGT GACGCCTGGC GGCGTGGAGA TCGGCCTGAT GGCCGGCTGC 
GATCCGTTCG ACACGCTGCC GGGACTGCCC GGACCTGCGG GATTGCCGCT GCTCACCGCC 
GAACTGCTGG CCCGAGGCGT GGACGAGGCA GTGATCGCCG CGACGCTCGG TGGCAATGTC 
CTGCGACTGT TCCGCGCCGA GCTCGGCGTG CCCGCGGAGC GTCGGGGAGC CGCCGCGTGA

Protein sequence

MGTTEGLDAS TLELHRRVVV ADTHNDLLCS VVLRPVAQWS DYFRAQWLPQ LRAGGVDVQV 
LPVFIDDSFR PEGALRQTLR MIEAAHRIAE GNADEVSLCL DGADIDRALD AGRIALVLAL 
ESAPGIDADI ELLTTLYRLG VRIASLAHFG RTPLADGSAE DAAGSRLTAA GVEAFAEMER 
MGMVFDVSHL GAAGVDHVLE LATRPLLATH SSARALCDHH RNLTDARLAA IAAGGGVVCV 
NFFPGFVDAH EPSVSRLVDH IEHIGKVAGT DHVGIGPDFV VEVLRDVTPG GVEIGLMAGC 
DPFDTLPGLP GPAGLPLLTA ELLARGVDEA VIAATLGGNV LRLFRAELGV PAERRGAAA