Gene Csal_0399 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0399
Symbol
ID	4025993
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	444149
End bp	446233
Gene Length	2085 bp
Protein Length	694 aa
Translation table	11
GC content	65%
IMG OID	637965548
Product	oligopeptidase A
Protein accession	YP_572460
Protein GI	92112532
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0339] Zn-dependent oligopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.905041
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTCATT CACACGTTCA TATCGAGGTG CCCATGTCAC GCAACCCCTT GCTCGAATCG 
CATGTCCTGC CGCCGTTCGA TGACATCCAG CCCGAGCATG TGGTGCCGGC CATCGAGCAG 
CTCCTGGCGG AGAATCGCCG TGACATCGAG GCCCTCGCCC AGCAGTCGCA GATCAGTTGG 
GAAAGCCTCG CCGCACCGTT GGAGGCCCTC AACGACCGGC TCTCCCAAGC CTGGTCGCCC 
GTGTCGCACC TCAATTCCAC CATGAACAAC GAGGCGCTGC GCGAGGCATA TCAGGCCTGT 
CTCGCCATGC TGTCCGACTA CAGCACCTGG CTCGGCCAGC ACCAGGGACT GTTCGAGGCC 
TTCACGCGCC TCAAGGAAAG CGACGAATAC GCACGTCTCG AGGAGGGCCA GCAGCGCTCC 
ATCGACAATA CCCTGCGCGA TTTCCGTCTC GCCGGTGTCG ATCTTCCCGA GGACCGGAAA 
CGCCGCTATG GCGAGATTCA AGCGCGCCTG TCGGAACTGG CCAACACGTT CTCCAATCAT 
GTGCTCGACG CCACCCAGGC ATGGCACCTC GACCTGACCG ACGACACGCG CCTTGGGGGC 
CTGCCCGACA GCGCCCTGGC CACGCTCAAG GCCAATGCCG AGGCCAAGGG CGTCGACGGT 
TACCGCATCA CGCTCGACTT CCCCAGCTTC TACCCGGTGC TCTCCTTCGC CGACGACCGC 
GCGCTGCGTG AAGAAGTCTA TACCGCCTTC GTGACCCGTG CCTCGGACAA GGGCCCGCAC 
GCCGGGCGTT TCGACAACGC CCCGATCATC GAGGAAACGC TGCGTCTGCG TCGCGAACTG 
GCCGAGCTGC TCGGCTTCGA CACCTATGCC GACTATTCGC TGGCCACCAA GATGGCCGAC 
TCGCCCCAGC AGGTACTGGG CTTCCTCGGT GACCTGGCCG ATCGTGCGCA CCCCCAGGCC 
CAGCGCGAAT TCAACGAGCT GGAGGCCTTC GCCCGCGAAT CGCTGGGACT CGAGACGCTG 
AAGCCGTGGG ATATCGGCTA TGTCAGCGAG AAACTGCGCG AGGCACGCTA TGCCATCTCC 
CAGGAACAGC TGCGCCCCTA CTTCCCGGCC CCCAGGGTGA TCGAGGGACT GTTCCAGGTT 
ACCGGCACCC TGTACGGCAT CGATTTCGCC GAACGTGACG ACGTGCCGCG CTATCACCCG 
GACGTGCGCT ACTTCGAGAT CCTCGACGGT GATACGCCCA TCGCCGGGTT CTACCTCGAC 
CTGTATGCCC GCGAAGGCAA GCGTGGCGGT GCCTGGATGG ACGAATGCCG TGTGCGGCGC 
ACCCGCGAGG ACGGCAGCCT GCAGCTGCCC GTCGCCTACC TGACCTGCAA CTTCACGCGC 
CCCGTGGGCG GCAAGCCCGC CCTGCTCACG CACGACGAGG TGCTGACGCT CTTCCACGAG 
TTCGGGCATG GCCTGCACCA CATGCTGACG CGGCAGACCG TCGCCGATGT CTCCGGCATC 
AATGGCGTCG CCTGGGATGC CGTCGAGCTG CCCAGCCAGT TCATGGAAAA CTTCTGCTGG 
GAGCGCGAGG GGCTGGACAT GATCGCCGCT CATGTGGATA CCGGCGAAAA ACTGCCTGAC 
GCCCTGCTCG ACAAGCTGCA GGCCGCACGC AACTTCCAGT CGGCCATGGG CATGATGCGC 
CAGCTCGAAC TGTCCCTGTT CGACTTCCGC CTGCATCATG AAAGCCAGGC GCCCAGTGCC 
GACGAGGTCC AGGCCCTGCT CGACGACGTG CGCGACAAGA CATCCGTCAC GCCGCGCGTC 
GACTTCAACC GTTTCCAGAA CGGCTTCGGC CATATCTTCG CCGGCGGTTA TGCCGCAGGC 
TATTACAGCT ACAAATGGGC CGAAGTCCTC TCGGCGGATG CCTACAGCGC CTTCGAGGAA 
GCCGGCATCT TCGACACGGC GACGGGCCAG CGCTTCCGTC AGGAAATTCT CGAACGGGGC 
GGTTCGCGCG ACGCCGCCGC CTTGTTCGAA GCCTTTCGGG GACGTGCACC GAGCATCGAA 
CCGCTACTGC GCCATTCCGG CATCGAGAGC GCCGAGGCGG CCTGA

Protein sequence

MLHSHVHIEV PMSRNPLLES HVLPPFDDIQ PEHVVPAIEQ LLAENRRDIE ALAQQSQISW 
ESLAAPLEAL NDRLSQAWSP VSHLNSTMNN EALREAYQAC LAMLSDYSTW LGQHQGLFEA 
FTRLKESDEY ARLEEGQQRS IDNTLRDFRL AGVDLPEDRK RRYGEIQARL SELANTFSNH 
VLDATQAWHL DLTDDTRLGG LPDSALATLK ANAEAKGVDG YRITLDFPSF YPVLSFADDR 
ALREEVYTAF VTRASDKGPH AGRFDNAPII EETLRLRREL AELLGFDTYA DYSLATKMAD 
SPQQVLGFLG DLADRAHPQA QREFNELEAF ARESLGLETL KPWDIGYVSE KLREARYAIS 
QEQLRPYFPA PRVIEGLFQV TGTLYGIDFA ERDDVPRYHP DVRYFEILDG DTPIAGFYLD 
LYAREGKRGG AWMDECRVRR TREDGSLQLP VAYLTCNFTR PVGGKPALLT HDEVLTLFHE 
FGHGLHHMLT RQTVADVSGI NGVAWDAVEL PSQFMENFCW EREGLDMIAA HVDTGEKLPD 
ALLDKLQAAR NFQSAMGMMR QLELSLFDFR LHHESQAPSA DEVQALLDDV RDKTSVTPRV 
DFNRFQNGFG HIFAGGYAAG YYSYKWAEVL SADAYSAFEE AGIFDTATGQ RFRQEILERG 
GSRDAAALFE AFRGRAPSIE PLLRHSGIES AEAA