Gene Cphy_3848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3848
Symbol
ID	5744800
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	4711613
End bp	4713079
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	40%
IMG OID	641294960
Product	anthranilate synthase component I
Protein accession	YP_001560934
Protein GI	160881966
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTATTAC CAAGGTATGA AGATTTGGCA GAGCTTTCAT TTAAATTCCC TTATGTTCCG 
GTATATAAAG AAATTTATTC AGATCAGACC ACACCAATCT TAGTGATGCA GAAACTATCG 
TTACACGCTA AAAACTATTA TCTATTTGAA AGTGCAGAGG GAAATGAGCG ATGGGGTCGC 
TATTCCTTTC TCGGATTTAC CCCAGTACTA AAGCTGTTTG GCAAGGGTGG CAAGGTTTTT 
CTTAAAAAAG GTTTAGAGGA AGAAGCCATA GAGCAAACAG GAGACAGCAT GCAGGCGATT 
CGAAGTCTCC TAAAGGAGTA TAGAGCACCA AAACTTGAGA AGCTTCCATC GTTTTCCGGA 
GGGCTTGTGG GGTACTTTGG CTATGAAATG ATAGGAAGAA TGGAACCTAA ATTACACCTT 
AGAGAGAGTG ATTTTGAGGA GTTTTCCTTA CAGCTTTATC TAGAGGTTAT AGCATTTGAT 
CATGTTAAAC AAAAGATGTA TCTGATTGAT CATTATCCAA CCAAGGAAGG AAGAAAAGGG 
TATGATGAGG CAGTTCTTCG TATCGAAGCC CTTGAAACCT TGTTAGTTGA AACGATACCG 
CCGGCCTTTC AGTTTAAGGA GGAAGCGCCT GTTTTTAAGA GTAATATAAC GAAGAAAGAG 
TACCTTGCTA TCATAGAGAA AACAAAGCAC TACATTAGGG AAGGTGATAT CTTTCAAGGA 
GTTATCTCAA GAAGGCTGGA GGCCACTTAT AAGAATAGCC TAATGAATGC ATATCGAGTA 
TTAAGAACGG CGAATCCTTC TCCATATATG TACTTTATTC ACTCTGGTGA TATTGAAATT 
GCTGGTTCAT CGCCAGAAAC CTTGGTAAAA GTCATCGATA GAGAAGTAAC TATCTTCCCA 
ATTGCAGGGA CTAGGCCCAG GGGGAGCACG GGTGAAGAAG ACGAAAAATT GGAAAAAGAA 
CTACTTGAAG ATGAAAAAGA ACTCGCGGAG CACAATATGT TAGTTGATTT GGCTAGAAAT 
GATGTGGGAA GAGTGGCAGC TTATCAATCG GTTGTAGTTG AAGAATATCT AAAGGTGCAT 
CGATACTCTA AGGTTATGCA CATTACTTCA AAGGTTAGTG GAAAGTTAAG AGAAGATAAG 
GATGGCTGTG ATGCACTAAT TGCATCCTTT CCAGCTGGAA CTTTGACTGG AGCACCAAAG 
ATACGTGCTT GTGAAATCAT AGAAGAGTTA GAAGAAAGTC CTAGAGGAAT CTATGGAGGT 
GCCATAGGGT ATTTTGACCT TTCTGGGAAT CTGGATTTTT GTATTGCAAT ACGAACAGCG 
GTTAAGAAGA AAGATAGCGT ATATGTTCAG GTTGGAGCTG GCATTGTGGC GGATAGTAAT 
AGTGAACTTG AGTATGAAGA AACAAATCAT AAGGCAGCGG CAGTTGTTGA TGCATTACTT 
AGAGCAGGGG AGGTAGATAG GGTATGA

Protein sequence

MVLPRYEDLA ELSFKFPYVP VYKEIYSDQT TPILVMQKLS LHAKNYYLFE SAEGNERWGR 
YSFLGFTPVL KLFGKGGKVF LKKGLEEEAI EQTGDSMQAI RSLLKEYRAP KLEKLPSFSG 
GLVGYFGYEM IGRMEPKLHL RESDFEEFSL QLYLEVIAFD HVKQKMYLID HYPTKEGRKG 
YDEAVLRIEA LETLLVETIP PAFQFKEEAP VFKSNITKKE YLAIIEKTKH YIREGDIFQG 
VISRRLEATY KNSLMNAYRV LRTANPSPYM YFIHSGDIEI AGSSPETLVK VIDREVTIFP 
IAGTRPRGST GEEDEKLEKE LLEDEKELAE HNMLVDLARN DVGRVAAYQS VVVEEYLKVH 
RYSKVMHITS KVSGKLREDK DGCDALIASF PAGTLTGAPK IRACEIIEEL EESPRGIYGG 
AIGYFDLSGN LDFCIAIRTA VKKKDSVYVQ VGAGIVADSN SELEYEETNH KAAAVVDALL 
RAGEVDRV