Gene Csal_2692 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2692
Symbol
ID	4028181
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	3017139
End bp	3019028
Gene Length	1890 bp
Protein Length	629 aa
Translation table	11
GC content	59%
IMG OID	637967900
Product	aminodeoxychorismate lyase apoprotein / aminodeoxychorismate synthase, subunit I
Protein accession	YP_574738
Protein GI	92114810
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0115] Branched-chain amino acid aminotransferase/4-amino-4-deoxychorismate lyase [COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00553] aminodeoxychorismate synthase, component I, bacterial clade

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACAACC TCGAAGAACA GCAGGACGAT AATATATTCA TACTGCTCGA AAATACACGC 
TGTTCGAACG GCAACCGTAC CTCTTTATTG TTCGAGAACC CGGTTTTCGA GGTTATATGC 
TATCGCAACG ACGCGTTGCG CGCCGCCTTG CGGGAGATCG ACGAGCTGCG TGGACAGGGC 
TATTACCTCA GCGGTTACCT CGCCTACGAA GCCGGTTATG CGCTTTCCGA CAAGCAGGAT 
TTCGCCTTTT GCCGGCGCCC TTCGAGCGAC ACGCCACTGG TGCATTTCTA TGCGTTTCGG 
GACGTACGGC GTTTGTCCCA GCAGCAAGCG AGCCGGTTCC TCGAGTCACG GACTCCCGAT 
GCCACGCCGT CGGCCATTCG CCACCTGGCA CTCAACGAAA CTCGCGACCG CTATCTCAAA 
AACATCGAAA AGATAAAGTC CTACATTCGT GAAGGCGATA CTTATCAAAT CAACTACACA 
CTGAAGTATC GTCTCGAATA TCAGGGATCG CCGATCACCT TGTATAGAAA ACTTCGTCAT 
CGACAAAAAG TCGAATTCGG CGGCTTCCTG AACTTTCCGG AATATTCAGT CCTTTCTCTG 
TCGCCGGAGC TGTTCCTGCG CAAACAAGGC ACCGCGCTGG AATCCAAGCC CATGAAAGGC 
ACTTTCCCGC GCGGCGTCAC GCCGCAGGAA GATGCCGGCA TTCTCGACAC CATGCGCCAT 
GATGCCAAGA CACGCTCGGA AAACGTGATG ATCGTCGATT TGCTGCGCAA CGACATCAGT 
CGTATTGCCT CACCAGGGTC GGTGGCCGTC AAGAACCTGT TCGAGATACA GACATTCGAG 
ACGCTGCACC AGATGATTTC CACGGTGACC GGCAGTATCG CCTCCGATGC CAGGATCGAG 
CATGTCTTCC GCGAACTGTT TCCGTGCGGT TCGATCACCG GAGCCCCCAA GATACGCACG 
ATGCAGATCA TCGAGGAGCT GGAACGCGAG CCACGCGGCG TCTATACCGG CGCGATCGGG 
TATCTCACGC CGCACAACGA CTTCTGCTTC AACGTTCCCA TTCGCACCTG CATCGCACAT 
GCCGACGGTA CGGCTGAGAT GGGCGTCGGC GGCGGTGTGC TCTTCGAGTC CGATGCCGAG 
GCGGAGTATG CGGAGTGCCT GCTCAAGGCA CGCTTCCTGA CGGGACTCAA TCAGGACCTG 
CAACTGATCG AGACGATGCG CTATTCCAAC GCCGAGGCAC GCATCGAGCA CCTCGAGGAA 
CATCTGCAGC GCCTGGCGCG TTCGGCGCAC GATCTGCAGT TCGTCTTCGA TGGGCCACGC 
GTGCGTGACG CCCTCGGCGA GGCCATCGCG GATCTTCGTC ACGATGCCAA GGTGCGCCTG 
TTGATGGCAC ACGACGGTCA GCTCGAGGTG ACCACGGCTC CGCTGCCGGC CATGCCCGAG 
AGTACGCAGA CCGCCCGCCT GGGGATCAGC GACCAGCGTA TCGACCGACG CGATTTCCTG 
CTGCAGTACA AGACGACGGA GCGTTCGCTG TACGAGCAGG CTTACCAGCA CCACCGCGAG 
GCCGGCGACT ACGACGTCGC TTTTCTCAAC GCGGAAGGAC GCCTGACCGA GGCGAGTCGC 
CACAACCTGT TCATCGAAAA GGACGGCCTG TTGCTGACGC CGCCGCTCGA GGAAGGCGTA 
TTGCCCGGCA TCGCCCGACG CATGCTCATC GAAACGAGTT GCGAGCGTTG CTGCGAGCGC 
CCGCTGACCC CGCAGGATCT GCTGGAGGCC GATGCCATCT GGTTGACCAA TGCCGTGCGT 
GGCGTCGTGC CGGTCACGCT CGGCAAGCAG GCTCGCCAAA CCCTCATCGC CGTGGCCGGT 
CAGGAGGCTG CACATGCTTT GCTTGATTGA

Protein sequence

MHNLEEQQDD NIFILLENTR CSNGNRTSLL FENPVFEVIC YRNDALRAAL REIDELRGQG 
YYLSGYLAYE AGYALSDKQD FAFCRRPSSD TPLVHFYAFR DVRRLSQQQA SRFLESRTPD 
ATPSAIRHLA LNETRDRYLK NIEKIKSYIR EGDTYQINYT LKYRLEYQGS PITLYRKLRH 
RQKVEFGGFL NFPEYSVLSL SPELFLRKQG TALESKPMKG TFPRGVTPQE DAGILDTMRH 
DAKTRSENVM IVDLLRNDIS RIASPGSVAV KNLFEIQTFE TLHQMISTVT GSIASDARIE 
HVFRELFPCG SITGAPKIRT MQIIEELERE PRGVYTGAIG YLTPHNDFCF NVPIRTCIAH 
ADGTAEMGVG GGVLFESDAE AEYAECLLKA RFLTGLNQDL QLIETMRYSN AEARIEHLEE 
HLQRLARSAH DLQFVFDGPR VRDALGEAIA DLRHDAKVRL LMAHDGQLEV TTAPLPAMPE 
STQTARLGIS DQRIDRRDFL LQYKTTERSL YEQAYQHHRE AGDYDVAFLN AEGRLTEASR 
HNLFIEKDGL LLTPPLEEGV LPGIARRMLI ETSCERCCER PLTPQDLLEA DAIWLTNAVR 
GVVPVTLGKQ ARQTLIAVAG QEAAHALLD