Gene Caci_2219 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_2219
Symbol
ID	8333565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	2518714
End bp	2519760
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	71%
IMG OID	644955370
Product	Chorismate binding-like protein
Protein accession	YP_003112979
Protein GI	256391415
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.294464
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.00136652
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCCCTCCC CTGCTCGCCG CCCGCCTCCG ATATCCGACC CCGAGCCGCT GGCCCACTTC 
GCCGGCCGAC TCGCGACCGG GCTGCGCGAC GTTACCTCGG ACCTGAGCGC CCTGGATTCC 
TCCGGCTTCT GGGCCGTCGT GGGCACCTAC GAAGGCGATT GGACCCTGGC GCGCTTCGAC 
GACGTCCGGG ACGCCCCGCT CCCCTCGCCA AGCACGCCCT GGATCGGTCC GGACCGCGAC 
GCGTGGATCT CCTCCATGGA TCAGGGCGCA TACGTGGGAG CTGTCAAAGC CATCCGCGAC 
GAGATCGCCG CCGGCGAGGT CTACCAGGTG AACCTCTGCC GCGTCCTGTC CGCGCCGATC 
GCTTCGCAGG CCGAACCCCT CGCCCTCGCC GCGCGCCTAC GCACGGGGAA CCCCGCTCCG 
TACGCCGGTC TGGTCAACGT CCCCGGCACC CGCGTGGTGA CCGCCTCCCC CGAGCTCTTC 
CTGCGCCGCG ACGGCCGCAC CGTCACCTCC GAGCCCATCA AGGGCACCGC GCGGACCGAG 
GAGGAATTTC TCCCGAAGGA CACCGCCGAG AACATCATGA TCGTCGACCT GGTCCGCAAC 
GACCTGGCGC GGGTCGCCGA GATCGGCTCC GTCGAGGTCC CCGCGCTGCT GCGTGTCGAG 
CCGCATCCCG GGCTCGTGCA CCTGGTCTCG ACCGTGACCG CCGAGCTGAC CGCCGATGTG 
GGCTGGCTAG AGCTGGTCGC GGCGACCTTC CCTGCGGGCT CCATCACCGG GGCGCCGAAG 
AGCAGCGCGT TGCGCATCAT CGACGAGCTG GAGAACGCGC CGCGCGGTCC GTATTGCGGT 
GCCGTCGGGT GGGTGGACGC CGATCGTGGT GTCGGCGAGC TGGCGGTGGG CATCCGTACG 
TTCTGGTGGC AGGACGACCG CCTGTGTTTC GGCACCGGTG CCGGCATCAC GTGGGGGTCG 
GATCCGCAGG GAGAATGGGA CGAGACCGAG CTCAAGGCCG CGCGGCTGCT GGCGGTCGCG 
TCGGGACCGC GGCCGGCCGC GCAGTGA

Protein sequence

MPSPARRPPP ISDPEPLAHF AGRLATGLRD VTSDLSALDS SGFWAVVGTY EGDWTLARFD 
DVRDAPLPSP STPWIGPDRD AWISSMDQGA YVGAVKAIRD EIAAGEVYQV NLCRVLSAPI 
ASQAEPLALA ARLRTGNPAP YAGLVNVPGT RVVTASPELF LRRDGRTVTS EPIKGTARTE 
EEFLPKDTAE NIMIVDLVRN DLARVAEIGS VEVPALLRVE PHPGLVHLVS TVTAELTADV 
GWLELVAATF PAGSITGAPK SSALRIIDEL ENAPRGPYCG AVGWVDADRG VGELAVGIRT 
FWWQDDRLCF GTGAGITWGS DPQGEWDETE LKAARLLAVA SGPRPAAQ