Gene Csal_1515 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1515
Symbol
ID	4029211
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	1723499
End bp	1724983
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	64%
IMG OID	637966698
Product	betaine aldehyde dehydrogenase
Protein accession	YP_573567
Protein GI	92113639
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01804] glycine betaine aldehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCACTT TCGAGACACA GAAGCTCTAT ATCGGTGGAC GACTCGTCGA CGCGACGTCG 
GGCGAGACCT TCGACACGAT CAACCCGGTG GATGGCAGCG TGCTGGCCAG CGTCCAGCAG 
GCCGCACAGG CCGATGTCGA CCGCGCCGTC ACCTCGGCCC GCGAGGGGCA GCGCGTCTGG 
GCGGCCATGA GCGGCATGGA GCGTAGCCGT ATCCTGCATC GCGCCGTCGC CCTGCTCCGC 
GAGCGCAACG ACGAACTGGC GCGCCTGGAA ACGCTGGATA CCGGCAAGCC GATCAGCGAA 
ACGCAAGCCG TGGACATCGT CACCGGTACC GACTCGCTGG AATACTATGC CAATCTGGCG 
CCCTCCATCG AAGGCACCCA GGTCCCGCTG CGCGAAGATT CGTTCTTCTA CACGCGCCGC 
GAACCGCTGG GCGTCATCGG TGCCATCGGG GCCTGGAACT ATCCCATCCA GATCGCCTGC 
TGGAAGTCCG CGCCGGCGCT GGCGGCGGGC AACGCCGTGG TGTTCAAGCC CAGCGAGGTC 
ACCCCGCTGA CCACCATGAA GCTGGCAGAG ATCCTGACCG AAGCCGGCCT GCCGGATGGC 
GTGTTCAATG TCGTGCAGGG CGACGGACGC GTCGGTCAGA TGCTCACCAA CCATGCCGAC 
ATCGACAAGA TCACCTTCAC CGGTGAAGTC GGGACCGGCA AGAAGGTCAT GGCCGCCGCC 
GCGGGATCGA CGCTCAAGGA AGTCACCATG GAGCTGGGCG GCAAGTCGCC GTTGATCGTC 
TTCGAGGATG CCGACCTGGA ACGTGCCGCC GACGCCGCGA TGATGGCCAA CTTCTACTCC 
AGCGGCCAGG TCTGCACCAA CGGCACTCGC GTCTTCGTGC AGCGCTCGGT GCAGGCGGAC 
TTCGAGGCCA AGATCAAGGA GCGTGTCGAG CGCATCAAGG CCGGCGATCC GCTGGATCCG 
GCGGTCAACT TCGGTCCGCT GGTCAGCTTC GAGCATCTCG AGAAGGTCCA GAGCTATATC 
GACCTGGGCA GCCAGGAAGG CGCTCGACTG CTGGTGGGCG GCGGTCGCTG GAACCAGGGC 
AATGCCGCGG GCATTGATTG GTCCAAGGGT GCGTGGGCCG CGCCGACGGT CTTTACCGAT 
TGCCGCGACG ACATGCGCAT CGTGCGCGAG GAAATCTTCG GACCGGTGAT GTCGATCCTG 
ACCTTCGACG ATGAAGAAGA AGTGATCCGG CGCTCCAACG ACACTTCCTA CGGCCTTGCC 
GCCGGCCTGT TCAGCGAAAG CCTGAACCGC GCGCATCGCG TCATTCATCG TCTGCAGGCC 
GGCATCTGCT GGATCAACAC CTGGGGCGAC TCGCCGGCGG AAATGCCGGT GGGCGGCTAC 
AAGGAGTCGG GCATCGGCCG TGAAAACGGT CTCTCGTCGC TCGATCAGTA CACGCAGATC 
AAATCGGTAC AGATCGAAAT GGGGCCCTTC CCCGCCGTGT TCTGA

Protein sequence

MATFETQKLY IGGRLVDATS GETFDTINPV DGSVLASVQQ AAQADVDRAV TSAREGQRVW 
AAMSGMERSR ILHRAVALLR ERNDELARLE TLDTGKPISE TQAVDIVTGT DSLEYYANLA 
PSIEGTQVPL REDSFFYTRR EPLGVIGAIG AWNYPIQIAC WKSAPALAAG NAVVFKPSEV 
TPLTTMKLAE ILTEAGLPDG VFNVVQGDGR VGQMLTNHAD IDKITFTGEV GTGKKVMAAA 
AGSTLKEVTM ELGGKSPLIV FEDADLERAA DAAMMANFYS SGQVCTNGTR VFVQRSVQAD 
FEAKIKERVE RIKAGDPLDP AVNFGPLVSF EHLEKVQSYI DLGSQEGARL LVGGGRWNQG 
NAAGIDWSKG AWAAPTVFTD CRDDMRIVRE EIFGPVMSIL TFDDEEEVIR RSNDTSYGLA 
AGLFSESLNR AHRVIHRLQA GICWINTWGD SPAEMPVGGY KESGIGRENG LSSLDQYTQI 
KSVQIEMGPF PAVF