Gene Clim_2047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2047
Symbol
ID	6355025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	2256123
End bp	2257544
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	55%
IMG OID	642669643
Product	isochorismate synthase
Protein accession	YP_001944055
Protein GI	189347526
COG category	[H] Coenzyme transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1169] Isochorismate synthase
TIGRFAM ID	[TIGR00543] isochorismate synthases

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.489046
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTATGC GTGAACAGCA GAACATCATC ATACCTGAAC AGGAACCCCT GCCGATTGAC 
CGGGCTGTAG CCGCCCTGCG GAAGGCGATA CAAGCTTATG ATCCCTCCGC AGTCAACAGA 
AGTCCGGCAC TGAGTATCTT CCGTCAGCGG GTTCTGCCGG CTGACCCCCT TATCTGGCTT 
TTCCGGCAGA GAGTCTTTCC CAGGGTATTC TGGATGAACC GGGAGAAAGA CTGCACCCTC 
GCGGGCATCG GTTCTGCCGA CTGGATACGG CACGAAGCGG AAGGCTCGAA CAGCGACAGC 
TTCGACCTCC TTGTGCGCAC ACTCTCGGAA AAAGATCCTG CCGTCCGTTA TATTGGCGGA 
TTCCGTTTCA ATAATATGGA AAGTCAGGAC GAAACGTGGA GTGCCTTCCC GTCATTCTCC 
TTCGTGCTCC CCCTCGTCCT GTATGCAGAA GAGAGAGACG GCTCCTGGTT GAGCTGCCAC 
CTCTTCGTGA AAGAGGGCGA AGATAGCGGC AGAAAAAAAA CCGTGCTGCT GCAAACGCTC 
GAAGCCCTCG ATCTCAAAGC TGACGCCGCT ATCCCGGAAA TGCCGCTCCT GAAACAGGCC 
TCCTGTATTC CTGACCGGAA ACTCTGGGTT GAAGGGTGCC GTAAAGCCCT GGGACTGTTT 
GCATCCGGCG AAATGGACAA AATCATGCTG GCCCGAAGAA CCGTTCTCGA GTTCGGCAGC 
AGTTTTTCTC CGCTGCTCTA CCTGATCCGC TACCCTTATC CCCGGAATGC GACATTCCGG 
TTCTGTTATG AGCCGATGGA AAATCATGCG TTCATCAGCT TTACGCCCGA ACGCCTCTAC 
CGGCGGGACG GGCAGATGAT TCTCACCGAA GCCCTGGCGG GAACCTGTCT GAAAGAGAGC 
ATGAACGGCA ACGATTTTCA CGCCTCGGAA ATACTGCTCA ACTCTGAAAA AGATATCAGG 
GAACACGGCT TTGTAAAAGA AGCCATATTC AGGGCGCTGC AGCCGGTTTC AAGCTCCTTT 
GAAATGGAGC AGAATCTCCG GGTACTGCAG CTGAACCGCC TGGCCCATCT CTATACCTGC 
TGTAAGGCAA CCCTGAAACC GGAGTACAGC AGCGACAGTA CCGTCCTCTC GGTACTGCAC 
CCGACCCCTG CTGTCGGCGG CGTGCCAAAA AACGAAGCGA TGCAGCATAT TCTGGATCTC 
GAACCGTTCT GCCGGGGCTG GTATGCCGCT CCCGTCGGAT GGATCAGCCG CGACAGCGCC 
GAGTTTGCTG TCGGTATCCG TTCAGCTCTG GTTTCTGAGG AGTTCACGAA CCTTTACTCC 
GGAGCCGGTC TGGTCGAAGG TTCGGATCCC GACCTCGAGT GGGATGAGAT AGAACAGAAA 
ATCGGCGACC TTATGGCTAT TGCGAGGGGT TCCCATGAAT AA

Protein sequence

MLMREQQNII IPEQEPLPID RAVAALRKAI QAYDPSAVNR SPALSIFRQR VLPADPLIWL 
FRQRVFPRVF WMNREKDCTL AGIGSADWIR HEAEGSNSDS FDLLVRTLSE KDPAVRYIGG 
FRFNNMESQD ETWSAFPSFS FVLPLVLYAE ERDGSWLSCH LFVKEGEDSG RKKTVLLQTL 
EALDLKADAA IPEMPLLKQA SCIPDRKLWV EGCRKALGLF ASGEMDKIML ARRTVLEFGS 
SFSPLLYLIR YPYPRNATFR FCYEPMENHA FISFTPERLY RRDGQMILTE ALAGTCLKES 
MNGNDFHASE ILLNSEKDIR EHGFVKEAIF RALQPVSSSF EMEQNLRVLQ LNRLAHLYTC 
CKATLKPEYS SDSTVLSVLH PTPAVGGVPK NEAMQHILDL EPFCRGWYAA PVGWISRDSA 
EFAVGIRSAL VSEEFTNLYS GAGLVEGSDP DLEWDEIEQK IGDLMAIARG SHE