Gene Csal_1605 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1605
Symbol
ID	4027567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	1825523
End bp	1826542
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	65%
IMG OID	637966794
Product	aminodeoxychorismate lyase
Protein accession	YP_573657
Protein GI	92113729
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0288124
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAACAAG GTAGCGACAT GCGAGTGGTC AAGATTTTAT TGGGCGGGGC GGCGCTGGTG 
GGCGTGGCGG CATTCGGCGC CTACCAGTAT TGGCAATCCC GGCTGGCGGC CCCGATCGCC 
CTCGAGGCGC CCACGATCTA CGAGGTGCCG CGTGGCGCGG GGTTCCAGCA AATCCTGGGC 
GAACTCGAGT CGCAAGGCAT CATCGAGGCC GCCTGGCCGT ACCGCGTGCT GGCGAAACTC 
TCGCCGGAAG CGGTGAACGG CCTGCGCTCC GGCGAGTTCG AGCTCACCCC GGGCATGAGC 
GGTCGCGAGA TGGTGGCATG GCTCTCCAGC GACAATATCG TCACCTATCG CCTCACCATT 
CCCGAGGGAT GGACGTTCGC GCAGATGCGT CGCGCACTGG CCGAGGCGCC CAAGCTCGAG 
CATCGCACGC AGGACATGAG CGATGCGGAG GTCATGGCGG CGCTGGGGCA TGAGGACGAG 
CATCCCGAAG GCCGCTTTTT CCCCGATACG TACCGCTATC ACAAGGGAAT GACGGATCTG 
GCGCTGCTCG AACGCGCCTA TGCGCGCATG GACAACATGC TGCGCGACGC CTGGGCGGGA 
CGCAGCGACG ATCTGCCGCT CGAGACGCCT TACGAAGCCC TCATCCTGGC GTCGTTGATC 
GAGCGCGAAA CGGGCGTGCC GAATGAGCGT CGGCGGATCG CCGGCGTCTT CGTGCGGCGT 
CTCGAGCGTG GCATGCGCCT GCAGACCGAT CCCACGGTCA TCTACGGCAT GGGCGAGGAC 
TACGATGGCA ACATCACGCG CGATGACCTG CGTCGCGAAA CGCCCTACAA CACCTACGTG 
ATCGACGGCC TGCCGCCCAC GCCGATCGCC ATGCCCGGCG AAGCTTCCCT GGAAGCTGCC 
GTGGACCCCG CCCCCGGGGA CGCCCTGTAT TTCGTGTCCC GGGGCGACGG ATCGCACTAT 
TTTTCCAGTA CGCTGGCCGA ACACAATGCC GCGGTACGCC GCTATATCCT CAACCGCTGA

Protein sequence

MKQGSDMRVV KILLGGAALV GVAAFGAYQY WQSRLAAPIA LEAPTIYEVP RGAGFQQILG 
ELESQGIIEA AWPYRVLAKL SPEAVNGLRS GEFELTPGMS GREMVAWLSS DNIVTYRLTI 
PEGWTFAQMR RALAEAPKLE HRTQDMSDAE VMAALGHEDE HPEGRFFPDT YRYHKGMTDL 
ALLERAYARM DNMLRDAWAG RSDDLPLETP YEALILASLI ERETGVPNER RRIAGVFVRR 
LERGMRLQTD PTVIYGMGED YDGNITRDDL RRETPYNTYV IDGLPPTPIA MPGEASLEAA 
VDPAPGDALY FVSRGDGSHY FSSTLAEHNA AVRRYILNR