Gene Rcas_4216 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4216
Symbol
ID	5541727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5453613
End bp	5455073
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	65%
IMG OID	640896323
Product	isochorismate synthase
Protein accession	YP_001434261
Protein GI	156744132
COG category	[H] Coenzyme transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1169] Isochorismate synthase
TIGRFAM ID	[TIGR00543] isochorismate synthases

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.192209
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.410479
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAAC CCTTCCAACA ACACTATGGT CGCCTGATCA GCCTGAGCAT GCCGTGCCCT 
GGCGTGTCTC CCGCCGATCT GTTGCGCCAT GCGCGCGGGC AGCCGCGATC ATTCTGGGAG 
AGCGCCCGCG ATGGGGTGGC GTTCGCCGGG ATGGGGATCG CGGTCGAACT GATGGCGTGG 
GGCGCCAATC GTTTTGTCGA AATCGAGCAG CAGGCGCGCG CGCTGTTCGA GAACGCCGTC 
ATGCTCGATG AGCGTGAGCC GCTGGCGGCG CCACGTCTCT TTGGCGGCTT TGCGTTCCAC 
AACGATTTCG TGCCCGATCT GGCATGGGCT GATTTCCCGC CAGCACATTT TGTGCTGCCA 
CACTACCAAC TGGTGCGCGT TCGCGATTCG TTCTGGTTGA CGCTGAACGT CCACGCGCCA 
CCTGGCGAGG ACCCGCGCGC GCTAGCGCCC GACTTGCGCG AGGCGCTGCT GGCGCAGGTC 
GATGCGCTTC AGAGCGAGCC GCCGCCACTG CCGCCGCGTT CGTCGGCGCG CCTTGCATAT 
CCCATGCCGT TCGAGCAGTG GGCGCGCAGT GTGGAACGGA TTGTCCGGCA GATCAACGTC 
GGTGAATTGA AGAAGGTCGT GCTGGCGCGG ATTGCCGAGG CATCGTTCGA CGCGCCGGTG 
GATGTCGATA GCGCCCTGGC GTGTCTGGCA CAGCGCTACC CCGACACGTA TCGCTTTCTC 
TTTGAGCCGC GTCCGGGGCG CGCATTCTTC GGCGCAACGC CGGAATTGCT GGCGCAGGTG 
AACGGCGACC GGGTGACGAC AATGGCGCTG GCAGGCAGCA TCCGGCGTGG CGCAACACCC 
GATGAAGATG AGCGTCTTGC TTTGGCGCTG CTCGATAGCG CAAAGGATCG CCACGAGCAT 
CAGATTGTGG TCGATGAGGT GCGCAATCGT CTGGCGTCGC TGACCAGGCG CCTGGATGTG 
GGAGCAACTG ATGTGATGCG GTTGAGCAAT ATTCAGCACC TGCACACGCC AATCAGTGGC 
GTACTGCGCG AGCCACGCGG CATTCTGCCG ATCATTGCGA CGCTCCACCC AACGCCTGCG 
CTCGGCGGTG AGCCGCGCGC GGCGGCGATG CGCCTGATCG CCGAACTGGA ACCGGCGCCG 
CGTGGCTGGT ATGCTGCGCC CGTCGGCTGG ATCGACCGGC GCCTGGATGG GCAGTTCGGG 
GTTGCCATTC GCTCGGCAGT GGTACAGGCG ACCCGCGCCT GGTTGTACGC CGGCGCCGGT 
ATCGTTGCCG CAAGCGATCC GCAACGCGAG TGGGACGAAA CGAACCTTAA GTTCCGTCCG 
ATGCTCGAGG GGTTGGGGCA CACGGATCGC CACGGGTTGG GGCACCTGGT AGGGACACGG 
ATCGCCACGG ATACGACGGA TCGCCACGGG TTGGGGCACA CGGATCGCCA CGGATACGAC 
GGATCGCCAC AGATTAAGTA A

Protein sequence

MTKPFQQHYG RLISLSMPCP GVSPADLLRH ARGQPRSFWE SARDGVAFAG MGIAVELMAW 
GANRFVEIEQ QARALFENAV MLDEREPLAA PRLFGGFAFH NDFVPDLAWA DFPPAHFVLP 
HYQLVRVRDS FWLTLNVHAP PGEDPRALAP DLREALLAQV DALQSEPPPL PPRSSARLAY 
PMPFEQWARS VERIVRQINV GELKKVVLAR IAEASFDAPV DVDSALACLA QRYPDTYRFL 
FEPRPGRAFF GATPELLAQV NGDRVTTMAL AGSIRRGATP DEDERLALAL LDSAKDRHEH 
QIVVDEVRNR LASLTRRLDV GATDVMRLSN IQHLHTPISG VLREPRGILP IIATLHPTPA 
LGGEPRAAAM RLIAELEPAP RGWYAAPVGW IDRRLDGQFG VAIRSAVVQA TRAWLYAGAG 
IVAASDPQRE WDETNLKFRP MLEGLGHTDR HGLGHLVGTR IATDTTDRHG LGHTDRHGYD 
GSPQIK