Gene Csal_2291 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2291
Symbol
ID	4026444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	2579328
End bp	2580785
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	64%
IMG OID	637967495
Product	succinate semialdehyde dehydrogenase
Protein accession	YP_574340
Protein GI	92114412
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01780] succinate-semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGTCCT TTCAGGAGAA CTCGCTGTTT CGTCCCTTTG CCTATATCGA TGGCAACTGG 
GTCGCAGCGG ATAGCGGCGA ACAGATCGAC GTCGACAACC CGGCCACCGG CGAGATCGTG 
GGGCGCATGC CGAAGCTGGG ACGTGCCGAG ACCGAGCGTG CCATCGAGGC CGCCGAATCG 
GCCTGGCCCG CCTGGCGCGC CCTGACGGCG CAGGAGCGGG CCGATATCCT GATGAAGTGG 
TACGAGCTGA TGCTCGAGCA TCAGGACGAA CTGGCGGCGA TCATGACCGC CGAACAAGGC 
AAGCCGCTCA AGGAAGCGGC CGGCGAGATC GCCTATGCGG CGAGCTTCAT GCGCTGGTTC 
GCCGAAGAAG CGCGGCGCGT GTATGGCGAT ACCATTCCGG CTGCCAAGGC CAATCAGCGG 
ATCGTCGTGC TCAAGCAGCC GGTGGGCGTC GTGGGGGCGA TCACGCCGTG GAACTTTCCC 
TCCTCGATGA TCACGCGCAA GGCGGCCGCG GCGTTGGCGG CAGGCTGCCC CATCGTCATC 
AAGCCGGCCA GCCAGACGCC GTTCTCGGCC ACGGCCCTGG CTGCGCTGGC CGAGCAGGCC 
GGTGTTCCCC GCGGTGTCTT CAACGTGGTG CCGGGGCGCG CCAGCGAGAT CGCCAAGGCG 
ATGACCGAGT CCCCCGTGGT ACGCAAGATT ACTTTCACCG GCTCCACCGA GGTGGGTAGC 
CAGTTGATGA GCGATGCGGC CCAGCATATT CAGAAGATTT CGCTGGAACT CGGCGGCAAT 
GCACCATTCC TGGTCTTCGA GGACGCCGAT CTGGACGCTG CCGTCGAAGG CGCCATGGCC 
AGCAAGTTCC GCAATGCCGG CCAGACTTGC GTGTGCACCA ACCGCTTCCT CGTGCAGTCG 
AGCGTGGTCA ATGCCTTCAG CGAGAAGCTC GCGGCGGCCA TGAACAGCGA GCTGCACGTC 
GGGCCGGGCA CCGAGGAGGG CGTGAATATC GGGCCTCTGA TCGACGAAAA CGCCGTCGCC 
AAGGTGTCGG AGCACATCCA GGATGCCGTC GACAAGGGCG CCGAACTGTT GCTGGGCGGC 
CATGCACACC CCCTGGGAGG ACGCTTCTTC ACGCCGACGC TGGTAAGCCA TGCCAACGCC 
GAGATGAAAG TGGCCCATGA GGAAACCTTC GGGCCACTGG CCGCGGTGAT CCCGTTCGAG 
GACGAGGAAG ACGCCGTGCG CATGGCCAAT GACACCCAGT TCGGCCTGGC CTCGTATTTC 
TATGCCAACG ACCTGAGCCG TGTCTGGCGT GTCGCGGAGG CGCTGGAGTA TGGCATGGTC 
GGCATCAATA CCGGTCTGAT TTCCAATGCC AGCGCGCCCT TCGGGGGAGT GAAGGCGTCG 
GGACTGGGAC GTGAAGGCTC CAAGTACGGT ATCGACGAAT ACATGGAAAC CAAGTACCTG 
TGCCTGGAGC TCGGCTGA

Protein sequence

MESFQENSLF RPFAYIDGNW VAADSGEQID VDNPATGEIV GRMPKLGRAE TERAIEAAES 
AWPAWRALTA QERADILMKW YELMLEHQDE LAAIMTAEQG KPLKEAAGEI AYAASFMRWF 
AEEARRVYGD TIPAAKANQR IVVLKQPVGV VGAITPWNFP SSMITRKAAA ALAAGCPIVI 
KPASQTPFSA TALAALAEQA GVPRGVFNVV PGRASEIAKA MTESPVVRKI TFTGSTEVGS 
QLMSDAAQHI QKISLELGGN APFLVFEDAD LDAAVEGAMA SKFRNAGQTC VCTNRFLVQS 
SVVNAFSEKL AAAMNSELHV GPGTEEGVNI GPLIDENAVA KVSEHIQDAV DKGAELLLGG 
HAHPLGGRFF TPTLVSHANA EMKVAHEETF GPLAAVIPFE DEEDAVRMAN DTQFGLASYF 
YANDLSRVWR VAEALEYGMV GINTGLISNA SAPFGGVKAS GLGREGSKYG IDEYMETKYL 
CLELG