Gene Csal_3081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_3081
Symbol
ID	4028887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	3431892
End bp	3433859
Gene Length	1968 bp
Protein Length	655 aa
Translation table	11
GC content	63%
IMG OID	637968295
Product	ATP-dependent metalloprotease FtsH
Protein accession	YP_575124
Protein GI	92115196
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0465] ATP-dependent Zn proteases
TIGRFAM ID	[TIGR01241] ATP-dependent metalloprotease FtsH

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.312439
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAACGACA TGGCGAAGAA CCTGATTCTC TGGTTGGTCA TCGCGGCGGT ATTGCTGACG 
GTGTTCAACA ACTTCAGCGT CGACAGCTCA CCTCAGGCGA TGAGCTACTC GCAGTTCGTC 
CAGCAGGTGC AGAACGACCA GATAGAAAGC GTGACCATCG AAGGCTACAC CATCAACGGT 
GAGCGTGAAG ACGGTACGCA GTTCCAGACG ATCCGTCCGG CGGCCGAAGA CCCCAAGCTG 
ATGGACGACC TGCTGGCGCA TGACGTCAGC GTGATCGGCA AGAAGCCCGA GGAGCAAAGT 
CTGTGGACGC GCCTGCTCGT GGCCAGCTTC CCGATCCTGA TCATCCTCGC GATCTTCATC 
TTCTTCATGC GTCAGATGCA AGGTGGCGGC GGTGGCAAGG GCGGCCCGAT GAGCTTCGGC 
AAGTCCAAGG CCAAGCTGCT GACGCAGGAT CAGATCAAGA CGACCTTCGC CGATGTCGCC 
GGCTGCGACG AGGCCAAGGA AGAAGTCGAG GAACTCGTCG ACTTCCTCAA GGACCCCAGC 
AAGTTTCAGC GGCTGGGCGG GCAGATACCG CGCGGCGTGT TGATGGTGGG GCCTCCGGGG 
ACGGGCAAGA CCCTGCTGGC CAAGGCCATC TCCGGTGAGG CCAAGGTCCC GTTCTTTACC 
ATTTCCGGCT CGGACTTCGT GGAAATGTTC GTCGGCGTGG GGGCCTCGCG TGTTCGCGAC 
ATGTTCGAAC AGGCCAAGAA GCAGGCCCCG TGCATCATCT TCATCGATGA GATCGATGCC 
GTGGGTCGTC ATCGTGGCTC CGGCATGGGG GGCGGTCACG ACGAGCGCGA GCAGACGCTC 
AACCAGTTGC TGGTGGAGAT GGACGGCTTC GAAGCCAACG ACGGCATCAT CGTGATCGCG 
GCCACCAACC GCCCCGACGT GCTCGACCCG GCACTGCTGC GTCCCGGCCG CTTCGACCGT 
CAGGTGACCG TGGGGCTGCC CGACATTCGC GGACGTGAGC ACATTCTTGG CGTGCACCTG 
CGCAAGGTAC CGCTGGCCGA CGATGTGCAG CCGAGCTTCA TCGCTCGCGG CACGCCTGGC 
TTCTCGGGCG CCGATCTGGC CAACCTGGTC AACGAGGCCG CCTTGTTCGC CGCGCGTCGC 
AACAAGCGCC TGGTGGGCAT GGACGAGCTC GAGATGGCCA AGGACAAGAT CCTGATGGGC 
TCCGAGAAGC GCTCGATGGT CATGTCCGAG AAAGAGAAGA GCAACACCGC GTACCACGAG 
TCGGGCCATG CCATCATCGG GCTGCTGATG CCCGAGCACG ACCCCGTCTA CAAGGTGACG 
ATCATCCCGC GCGGGCGTGC CCTGGGTGTC ACCATGTTCC TGCCCGAGGA GGATCGCTAC 
AGCCTCTCTC GGCAGCAGAT CATCAGTCAG ATCTGCTCGT TGTTCGGCGG CCGCCTCGCG 
GAGGAAATGA CCCTGGGGCC GAATGGCGTC ACCACCGGGG CGTCCAACGA CATCAAGCGC 
GCCACCGAAC TGGCCCACAA CATGGTCGCC AAGTGGGGGC TCTCGGAAGA GATGGGCCCG 
CTGATGTACG ACGAGGACGA GTCGCATCAA TTCCTGGGCG GCGGCGGCCA GGGCGGCGGC 
AAGCTGAAGT CGGGCGAGAC CACGACGCGT CTCGACAAGG AAGTGCGCAG GATCATCGAC 
GAGTGCTATA ACAAGGCGCG CCAGATCCTG GAAGACAATC GTGACAAGCT GGACCTGATG 
GCTGAATCGT TGATGCAGTA CGAAACCATC GATGCCAACC AGATCCGCGA CATCATGGAA 
GGTCGCAAGC CGCGTCCGCC GGAGGACTGG GACGACAAGG GGCCGACGAC CGGCTCGGGG 
TCGACCGCAA ATCCCTCTGC CGACGATGAA GCCGAAGGGC AGGGCGACGA AGAAGGCGAC 
ACCAGTCGTC GTCCCTCGGA TCCCCTGGGT GGGCCGGCGG GGCACTGA

Protein sequence

MNDMAKNLIL WLVIAAVLLT VFNNFSVDSS PQAMSYSQFV QQVQNDQIES VTIEGYTING 
EREDGTQFQT IRPAAEDPKL MDDLLAHDVS VIGKKPEEQS LWTRLLVASF PILIILAIFI 
FFMRQMQGGG GGKGGPMSFG KSKAKLLTQD QIKTTFADVA GCDEAKEEVE ELVDFLKDPS 
KFQRLGGQIP RGVLMVGPPG TGKTLLAKAI SGEAKVPFFT ISGSDFVEMF VGVGASRVRD 
MFEQAKKQAP CIIFIDEIDA VGRHRGSGMG GGHDEREQTL NQLLVEMDGF EANDGIIVIA 
ATNRPDVLDP ALLRPGRFDR QVTVGLPDIR GREHILGVHL RKVPLADDVQ PSFIARGTPG 
FSGADLANLV NEAALFAARR NKRLVGMDEL EMAKDKILMG SEKRSMVMSE KEKSNTAYHE 
SGHAIIGLLM PEHDPVYKVT IIPRGRALGV TMFLPEEDRY SLSRQQIISQ ICSLFGGRLA 
EEMTLGPNGV TTGASNDIKR ATELAHNMVA KWGLSEEMGP LMYDEDESHQ FLGGGGQGGG 
KLKSGETTTR LDKEVRRIID ECYNKARQIL EDNRDKLDLM AESLMQYETI DANQIRDIME 
GRKPRPPEDW DDKGPTTGSG STANPSADDE AEGQGDEEGD TSRRPSDPLG GPAGH