Gene Csal_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0020
Symbol
ID	4027339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	24625
End bp	26139
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	64%
IMG OID	637965172
Product	L-threonine ammonia-lyase
Protein accession	YP_572084
Protein GI	92112156
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01124] threonine ammonia-lyase, biosynthetic, long form

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.381683
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTAGAAG AGACCGTCAA GAAAATCCTC CAGGCTCGCG TTTACGAAGC GGCCCGGGAA 
ACGCCGATAT CCCCTGCTCC CTTTCTCTCC CGCCGTCTCA ACAACACGAT TCTGATCAAG 
CGCGAGGATT TGCAGCCGGT CTATTCCTTC AAGATTCGCG GCGCCTACAA CAAGATGGCC 
CAGCTGAGCG ATGAACAGAA GGCCAAGGGC GTGATCGCCG CGTCCGCCGG CAACCATGCC 
CAGGGCCTGG CCATGGCCGC CAAGCAGATG GGCGTCAAGG CGGTCATCGT GATGCCGCGC 
ATCACGCCCG ACATCAAGGT CCAGGCCGTG CGCGCGCGTG GCGCCAAGGT CGTGCTCAAG 
GGCGATGCCT TCGGCGAGGC GCTGGCACAT GCGCGCGAGC TGATCGACGA GCATGGCTAC 
ACCTACATTC CGCCCTTCGA CGATAACGAC GTGATCGCCG GCCAGGGCAC GGTGGGCATG 
GAGATCCTGC GTCAGCACAG CGGACCGCTG GACGCGGTAT TCGTGCCCGT GGGCGGTGGC 
GGCCTGCTCG CCGGCGTGGT GGCGTACATC AAGTACCTGC GCCCCGAGAT CAAGGTGTAC 
GGGGTCGAGG CGGAAGACGC TGCCTGCCTC AAGGCGGCCC TGGAAGCCGG CGAACGGGTC 
ACCCTCGACC AGGTCGGCGT GTTCGCCGAG GGCGTCGCCG TGGCGCAGAT CGGCGAAGCG 
CCGTTCGAGA TCCTGCGCCA CTGGGTGGAT GGCGTGATCA CCGTCACCAC CGATGAGATG 
TGCGCGGCGG TCAAGGACAT CTTCGAGGAT ACGCGGGCGG TCGCCGAGAC CTCCGGCGCG 
CTGTCGCTGG CGGGGCTCAA GAAATACATC CAGCAGCAGA ACGCCGAGGG CGAGACCCTG 
CTGTGCATCA ACTCGGGCGC CAACACCAAT TTCGATCGTC TGCAGCACAT CGCCGAGCGC 
ACGGAGCTGG GCGAGCAGCG CGAGGCGATT CTGGCGGTGA CGATTCCCGA ACGGCCGGGC 
AGTTTCAAGA AATTCTGCAA GACCATCGGC AAGCGCATGG TCACCGAGTT CAATTACCGC 
TATGCCGACC CCGACCACGC GCACATCTTC GTCGGCGTGC AGGTCAAGCC GGGCGGCGAG 
GACCGCCAGG CGGTGATCGA CAAGTTGCGC GAGGCCGGTT ATCCGGTGGA GGACCTCACC 
GACAACGAAC TGGCCAAGCT GCATATTCGC CATCTCGGTG GCGGGCGTCC CAAGGAGCAC 
TTCAGCGAAG AAGTCTACCG GTTCGAGTTC CCCGAACGCC CCGGGGCGCT GATGAACTTC 
CTGACTCATC TGCCCGGCGA CTGGAACATT TCACTGTTCC ACTACCGCAA CCATGGCGCG 
GCGTATGGCC GAGTGCTGGT GGGCATGCAG ATCCCCAATG GCGCCCGGGC GCATGTCGAG 
GAACATTTCG AACGCATCGG CTATCGCTAC TGGAAGGAAT CCGACAATCC CGCCTATCGT 
CTGTTCATGG CCTGA

Protein sequence

MLEETVKKIL QARVYEAARE TPISPAPFLS RRLNNTILIK REDLQPVYSF KIRGAYNKMA 
QLSDEQKAKG VIAASAGNHA QGLAMAAKQM GVKAVIVMPR ITPDIKVQAV RARGAKVVLK 
GDAFGEALAH ARELIDEHGY TYIPPFDDND VIAGQGTVGM EILRQHSGPL DAVFVPVGGG 
GLLAGVVAYI KYLRPEIKVY GVEAEDAACL KAALEAGERV TLDQVGVFAE GVAVAQIGEA 
PFEILRHWVD GVITVTTDEM CAAVKDIFED TRAVAETSGA LSLAGLKKYI QQQNAEGETL 
LCINSGANTN FDRLQHIAER TELGEQREAI LAVTIPERPG SFKKFCKTIG KRMVTEFNYR 
YADPDHAHIF VGVQVKPGGE DRQAVIDKLR EAGYPVEDLT DNELAKLHIR HLGGGRPKEH 
FSEEVYRFEF PERPGALMNF LTHLPGDWNI SLFHYRNHGA AYGRVLVGMQ IPNGARAHVE 
EHFERIGYRY WKESDNPAYR LFMA