Gene Cpha266_2088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_2088
Symbol
ID	4570436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	+
Start bp	2420529
End bp	2421962
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	52%
IMG OID	639766670
Product	isochorismate synthases
Protein accession	YP_912524
Protein GI	119357880
COG category	[H] Coenzyme transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1169] Isochorismate synthase
TIGRFAM ID	[TIGR00543] isochorismate synthases

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000640643
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGACA AGCGACATAC CATTATTGCT GACAACAACC CGCTTCCTCT GCAAAAGGCC 
GTTCAAAGCC TTCTGCGCGA GGTTGAACGG TTAAAAGAGA GAACGACAGA TCGATTCGAA 
GAAAGCCCGT CCGGCTCGCT TCTGACCATC AGCCAGCCTC TTCTTCCGCT CGATCCGCTT 
GACTGGCTTA ACCGCCAGCA TCTCTTCCCC AAACTGTACT GGATGAACCG CGAAAAAAGT 
TTTTCGGTCG CAGGAATAGG TACGGCTGAT TGCATTGAAC AAAACACGCC GGGCACAAAC 
GCATCGAGTT TTGCCGAGCT TACCCGGACA ATAGCCACAA AAGATCCCGA CGCGCGGTAT 
TTCGGAGCAT TCCGGTTCAA CAATATGGAG GAACAAAGCG AGCCGTGGCA CTCATTCTCC 
TCCTATGCTT TTGTTCTGCC CCTTGTCGGG ATAACGTTTG AACAGGAACG GTACGTACTC 
TTCTGCAATC TTTGGCTGGA ACCGGGGGAG GCGCCTGACA TAAAAATCCG GAGCATTTGT 
GATGCTCTCG AAAACATGTC GACCACGCAG TCGGATTGCG ATAGCGACCG AAATATTCCC 
GCACTGGTGC GTATCTCCCG CAATCCGGAT GTACAAAGCT GGACCAGACA GTGCGAACGG 
GCACTGCGAA CATTCGAGGC AGGCGACATG GATAAAATCA TGCTGGCCCG ACAAACCATT 
CTTGAATTTT CGGAAAGTTT TTCGCCGCTG CTTTTTCTCA TCAACTATCC TTATCCGAAA 
AACTCGACCT ACCGGTTTTA CTTTGAGCCG AAAAAAAACC ATGCGTTTTT CAGTTTCACT 
CCTGAACGCC TCTATCGCAG GGATGGCGTC ACGTTGCAGA CCGAAGCCCT TGCGGGAACC 
AGTCTGAAAG AGAATCTCAC CGGTGACGAC AACCTTGCTT CCGAAGTCCT TCTGAACTCC 
GAAAAAGATA TCAGGGAACA CAAATTCGTC AAAGACAGCA TCTACGGGGA GCTGTTTCCG 
GTTTGCAGCG AGATTCAGAT GGATGAACAG GTCCATGTGC TTCAACTGAA CCGTCTGGCT 
CATCTTTATA CCCGATGCAG CGCAACGCTC AAGCCGGAGT TCAGCAATGA CAGTACCTTG 
CTCACCCGCC TCCACCCTAC GCCTGCCGTT GGAGGAGTTC CGAGGGATGA GGCGCTTCGG 
CATATTCTCG ATATTGAACC CTTCAACCGC GGGTGGTATG CCGGCCCTGC CGGATGGATA 
AGCAGCAATG CCGCTGAATT CTGTGTCGGC ATCCGATCCG GAGTCGTTGT CGAAGCGATG 
ACCTTTCTCT ACTCCGGTGC CGGTCTGGTC AAGGGATCAG ACCCCGTCTC GGAATGGGAT 
GAAATCGAGC AGAAAATCGG AGATCTCCTG ACCACAGCAA ACGGCGATAC ATGA

Protein sequence

MSDKRHTIIA DNNPLPLQKA VQSLLREVER LKERTTDRFE ESPSGSLLTI SQPLLPLDPL 
DWLNRQHLFP KLYWMNREKS FSVAGIGTAD CIEQNTPGTN ASSFAELTRT IATKDPDARY 
FGAFRFNNME EQSEPWHSFS SYAFVLPLVG ITFEQERYVL FCNLWLEPGE APDIKIRSIC 
DALENMSTTQ SDCDSDRNIP ALVRISRNPD VQSWTRQCER ALRTFEAGDM DKIMLARQTI 
LEFSESFSPL LFLINYPYPK NSTYRFYFEP KKNHAFFSFT PERLYRRDGV TLQTEALAGT 
SLKENLTGDD NLASEVLLNS EKDIREHKFV KDSIYGELFP VCSEIQMDEQ VHVLQLNRLA 
HLYTRCSATL KPEFSNDSTL LTRLHPTPAV GGVPRDEALR HILDIEPFNR GWYAGPAGWI 
SSNAAEFCVG IRSGVVVEAM TFLYSGAGLV KGSDPVSEWD EIEQKIGDLL TTANGDT