Gene Csal_2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2044
Symbol
ID	4025940
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	2305233
End bp	2307641
Gene Length	2409 bp
Protein Length	802 aa
Translation table	11
GC content	62%
IMG OID	637967239
Product	Lon-A peptidase
Protein accession	YP_574094
Protein GI	92114166
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0466] ATP-dependent Lon protease, bacterial type
TIGRFAM ID	[TIGR00763] ATP-dependent protease La

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGCAGA ACGCTGAACA GACCTTAAGT CTTCCCCTTT TGCCGCTGCG GGACGTGGTC 
GTCTATCCGC AGATGGTGAT TCCGCTGTTC GTGGGGCGCG AGAAATCGAT TCGCGCGCTC 
GAGACGGCCA TGGAAAACGA CAAGCGTATC TTGCTCGTGG CCCAGCGTGA GGCGAGTCAG 
GACGATCCGG AATTCGGCGA CCTTTTCGAT GTCGGGACCG TGGCCGAGAT CATGCAACTT 
CTCAAGTTGC CGGACGGCAC CGTCAAGGTA TTGATCGAAG GTGACTATCG CGCCGACATT 
CGTGATGTCC ATGAGGACGC GTCCGGTTAT GTATCGGCCG AGGCCACGCG TCGCGAGAGC 
GAGGCATTGA CCGAGCGCGA GCAGGAATCG CTCGTGCGGG TCCTGCTGAA TCAGTTCGAG 
CAATATGTAA AGCTGTCCAA GAAGGTGCCC AACGAAGTCC TCAATTCGTT GTCCGGCATC 
GAGGACCCGA GCCGCCTGGT CGATACGATC TGCGCGCACT TGTCGCTCAA GATCGGCGAC 
AAGCAGGAGC TGCTCGAGAT GGATCGCGTA CGCGATCGCA TCGAGCACCT GATGGCCTTG 
ATCGAGTCCG AGATCGATCT GTTGCAGGTG GAAAAGCGCA TCCGTTCGCG GGTCAAGGAC 
CAGATGGAGA AGTCCCAGCG CGAGTACTAT CTCAACGAGC AGATGAAGGC CATCCAGAAG 
GAGATGGGCG AGCTCGAGAA CGCGCCCAAC GAGGCCGACA AGTACGAGCA GCTGATCGAG 
TCGTCCGGCA TGCCCAAGGA AGCGGCCGAC AAGGCGCGCC AGGAGCTGGG CAAGCTCAAG 
ATGATGGCGC CGACATCCGC CGAGGCGACC GTGGTGCGTT CGTACCTCGA TTGGCTGGTG 
GCGGTACCCT GGAAGAAGCG CTCGCGCGTG CGGCACGACC TGGTGCATGC CCAGAAGGTG 
CTCGACGAGG ACCATTACGG GCTGGAAGAG GTCAAGGAGC GCATCCTCGA GTACCTGGCC 
GTGCAGAAGC GCGTCAAGAA GCTCAAGGGG CCGGTGCTGT GCCTGGTGGG CCCGCCCGGG 
GTCGGCAAGA CCTCGCTCGG TCAGTCGATC GCACGGGCGA CCAACCGGCG TTACGTGCGC 
CTGGCGCTGG GGGGTATCCG CGACGAGTCC GAGATTCGCG GGCATCGCCG TACTTACATC 
GGCTCGCTGC CCGGCAAGCT GATTCAGCGC ATGAGCAAGG CCGAGGTACG CAACCCGCTC 
TTCTTGCTCG ACGAGGTCGA CAAGATCGGC ATGGATCATC GCGGCGACCC CTCGTCGGCG 
TTGCTCGAAG TACTCGACCC CGAGCAGAAC AATACCTTCA GCGACCATTA CCTGGAGCTG 
GATTACGACC TCTCCGACGT CATGTTCATC TGCACCGCCA ACTCGATGAA CATCCCGGAG 
CCGCTGCTCG ACCGCATGGA GATCATTCGC CTGCCCGGTT ACACGGAAGA CGAAAAGCTC 
GCCATCGCCA AGCGTTACCT GGTGCCCAAG CAGCTCAAGG CCAACGGGCT CAAGGAGGAC 
GAGCTGAGCT TCTCTGACGA ATCTCTGCTC GAGCTGGTGC GTTATTACAC CCGCGAGGCG 
GGCGTTCGTG AGCTGGAGCG CCAGATCGCC AAGGTGAGCC GCAAGGTGCT GCGCGAACGT 
GTCGAGGCCG AGAAGCAGCA AGGTGCGAAA GGGCCGCAAC TGCTGGCGGC TGCGGACATC 
GAGACCTATG CCGGCGTGCG TCGCTACAGC TATGGCCTGG CCGATAAGGA AGACCAGGTC 
GGGCGCGTCA CGGGGCTGGC CTGGACATCG GTGGGGGGCG AGCTGCTCAA CATCGAGTCG 
GTGGTCTCCC CGGGCAAGGG GCGCCTGAAC AAGACCGGTT CGCTCGGCGA TGTGATGAAA 
GAGTCGGTGA GTGCGGCGCT TACCGTGGTG CGGGCACGCG CCGAAGCGCT GGGTATCGAT 
CCCGAGCGCT TCGAGAAAGA GGACCTCCAC ATTCACGTCC CCGAGGGCGC CACGCCCAAG 
GATGGGCCGA GTGCGGGCAT CGCCATGGTG ACGGCGATGG TCTCGGCCTA CACCGGGCGT 
CCGGTGCACT GTGACGTGGC CATGACCGGT GAAGTCAACC TGCGTGGCGA GGTCATGCCG 
ATCGGCGGGC TCAAGGAGAA ATTGCTGGCG GCGCGACGCG GTGGTATAAA GACGGTGCTC 
ATACCGGAGG AAAATCGCCG GGATCTCAAG GAAGTGCCGG ACAATATCAA GGATGCCCTG 
GATATCCGGC CCGTCAAATG GATTGATGAA GTTCTCGACG CGGCGCTGGT GGAAAAAGCA 
GAGGTGGAAA GCGGTGAATC CCTAGCGGAA ACCAGCCAAC CGACGCGTTC CAATATCAGC 
ACGCATTGA

Protein sequence

MEQNAEQTLS LPLLPLRDVV VYPQMVIPLF VGREKSIRAL ETAMENDKRI LLVAQREASQ 
DDPEFGDLFD VGTVAEIMQL LKLPDGTVKV LIEGDYRADI RDVHEDASGY VSAEATRRES 
EALTEREQES LVRVLLNQFE QYVKLSKKVP NEVLNSLSGI EDPSRLVDTI CAHLSLKIGD 
KQELLEMDRV RDRIEHLMAL IESEIDLLQV EKRIRSRVKD QMEKSQREYY LNEQMKAIQK 
EMGELENAPN EADKYEQLIE SSGMPKEAAD KARQELGKLK MMAPTSAEAT VVRSYLDWLV 
AVPWKKRSRV RHDLVHAQKV LDEDHYGLEE VKERILEYLA VQKRVKKLKG PVLCLVGPPG 
VGKTSLGQSI ARATNRRYVR LALGGIRDES EIRGHRRTYI GSLPGKLIQR MSKAEVRNPL 
FLLDEVDKIG MDHRGDPSSA LLEVLDPEQN NTFSDHYLEL DYDLSDVMFI CTANSMNIPE 
PLLDRMEIIR LPGYTEDEKL AIAKRYLVPK QLKANGLKED ELSFSDESLL ELVRYYTREA 
GVRELERQIA KVSRKVLRER VEAEKQQGAK GPQLLAAADI ETYAGVRRYS YGLADKEDQV 
GRVTGLAWTS VGGELLNIES VVSPGKGRLN KTGSLGDVMK ESVSAALTVV RARAEALGID 
PERFEKEDLH IHVPEGATPK DGPSAGIAMV TAMVSAYTGR PVHCDVAMTG EVNLRGEVMP 
IGGLKEKLLA ARRGGIKTVL IPEENRRDLK EVPDNIKDAL DIRPVKWIDE VLDAALVEKA 
EVESGESLAE TSQPTRSNIS TH