Gene Csal_2449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2449
Symbol
ID	4026969
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	2754022
End bp	2755332
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	63%
IMG OID	637967656
Product	isocitrate lyase
Protein accession	YP_574495
Protein GI	92114567
COG category	[C] Energy production and conversion
COG ID	[COG2224] Isocitrate lyase
TIGRFAM ID	[TIGR01346] isocitrate lyase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.155678
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCAGA CACGCGAACA GCAAATCGCT GCGTTGGAAA AGGATTGGAA CGAGAATCCG 
CGCTGGAAGG ACGTCAAGCG TCCGTACAGT GCCGAAGATG TGGTTCGACT TCGCGGCAGC 
GTCAACGAAG CGCACACGCT GGCCAGCCGC GGCGCCGAGA AGCTCTGGCG ACTGGTCAAT 
GGCGAGGCCC GCAAGGGCTA CGTCAACTGC CTCGGCGCGC TGACCGGCGG CCAGGCCATG 
CAGCAGGTCA AGGCAGGTAT CGAGGCGATC TATCTCTCGG GCTGGCAGGT CGCCGCCGAC 
AACAACAGCT ACCTGTCGAT GTATCCCGAC CAGTCGCTCT ATCCGGTGGA CTCGGTGCCC 
AAGGTCGTCG AACGCATCAA CAACAGTTTC CGCCGCGCGG ATCAGATCCA GTGGCAGAAG 
GGCGCCAACC CCGGCGATGC CGACTTCGTC GATTACTTCG CCCCCATCGT CGCCGACGCC 
GAGGCGGGAT TCGGCGGCGT GCTCAACGCC TATGAACTGA TGACGGCAAT GATCCGTGCC 
GGTGCCAGTG GCGTGCATTT CGAGGATCAG CTCGCCGCGG TCAAGAAGTG CGGCCACATG 
GGCGGCAAGG TGCTGGTGCC CACGCAGGAG GCCGTGCAGA AGCTGGTCGC CGCCCGTCTG 
GCCGCCGACG TCGCGGGCAC GCCGACGCTG GTCATCGCGC GCACCGACGC CAATGCCGCC 
AACCTGATCA CCGCCGACGT GGATGATTAC GACAAGCCCT TCATCACCGG GGAACGCACC 
GCCGAAGGCT TCTATCGGGT CAATGCCGGC CTCGATCAGG CCATCTCGCG AGGCCTGGCC 
TACGCGCCCT TCGCCGACAT CATCTGGTGC GAAACCGCCA AGCCGGATCT CGACGAAGCC 
AGGCGCTTCG CCGAGGCGAT CCATCGCGAA TATCCGGGGC AACTGCTCGC CTACAACTGC 
TCGCCGTCCT TCAACTGGAA GAAGAACCTC GACGATGCCG AGATCGCCGG GTTCCAGCAG 
GCCCTGGCCG ACATGGGCTA CACCTACCAG TTCATCACCT TAGCGGGCAT TCACAACATG 
TGGTACAACA TGTTCGATCT CGCCCACAGC TACGCTCAGG GCGAAGGCAT GAAGCACTAC 
GTCGAGAAGG TCCAGCAGCC GGAATTCGAG GCCGCCGAAC GCGGCTACAC CTTCGTCGCT 
CACCAGCAGG AAGTGGGCAC CGGCTACTTC GACGACATGA CCAACGTCAT CCAGGGCGGA 
GTGTCGTCGG TGACCGCCCT CAAGGGCTCC ACCGAGGAAG CGCAGTTCTG A

Protein sequence

MSQTREQQIA ALEKDWNENP RWKDVKRPYS AEDVVRLRGS VNEAHTLASR GAEKLWRLVN 
GEARKGYVNC LGALTGGQAM QQVKAGIEAI YLSGWQVAAD NNSYLSMYPD QSLYPVDSVP 
KVVERINNSF RRADQIQWQK GANPGDADFV DYFAPIVADA EAGFGGVLNA YELMTAMIRA 
GASGVHFEDQ LAAVKKCGHM GGKVLVPTQE AVQKLVAARL AADVAGTPTL VIARTDANAA 
NLITADVDDY DKPFITGERT AEGFYRVNAG LDQAISRGLA YAPFADIIWC ETAKPDLDEA 
RRFAEAIHRE YPGQLLAYNC SPSFNWKKNL DDAEIAGFQQ ALADMGYTYQ FITLAGIHNM 
WYNMFDLAHS YAQGEGMKHY VEKVQQPEFE AAERGYTFVA HQQEVGTGYF DDMTNVIQGG 
VSSVTALKGS TEEAQF