Gene CPF_1119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1119
Symbol	gngC
ID	4203716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1278343
End bp	1279605
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	32%
IMG OID	638082000
Product	endo-beta-galactosidase, GlcNAc-alpha-1,4-Gal-releasing
Protein accession	YP_695565
Protein GI	110800048
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.308798
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGTCT TTATGTTACT ATTGTTGCTA CCATTTACTA TTTCAAAAGC AAAGGATTTT 
CCAGCAAATC CAATTGAAAA AGCTGGATAT AAACTAGATT TTTCTGATGA GTTCAATGGT 
CCTACATTAG ATAGAGAAAA ATGGACTGAT TATTATTTAC CACATTGGTG CAAGGATCCT 
GAAAGTGCTA AGGCTAATTA TCGCTTTGAA AATGGATCAC TTGTTGAATA TATAACTGAA 
GATCAGAAAC CATGGTGCCC AGAGCATGAT GGAACTGTTA GATCATCTGC CATAATGTCT 
TTTGATAAAA GTTGGATACA TAATTTTAGT GGAACAACTG ATAATCATGA AAGAAATGAG 
TGGAGAGGTT ATACAACTAA ATATGGATAC TTTGAAATTC GTGCTAAGTT ATCTAACACA 
GGTGGTGGAG GCCATCAAGC TTGGTGGATG GTTGGTATGC AGGATGATAC TAATGATTGG 
TTCAATTCAA AACAAACAGG TGAAATTGAT ATATTAGAAA CTTTCTTTAG TAAAAAAGAT 
ACATGGAGAA TCGCTGCATA TGGATGGAAT GATCCAAACT TCCAAACATC TTGGACTATT 
TCAGAAGATA AAGTTCCATC AGGAGATCCA ACTTCTGAAT ATCATATTTA TGCAATGGAA 
TGGACTCCTA CTGCTTTGAA ATTTTATTAT GATAATGAAT TATTTAAGGT TATATATGGT 
TCACCAGACT ATGAAATGGG GACAATTTTA AATATATACA CAGATGCAGG TTCAGGTGTT 
CATAATGATG TTTGGCCTAA GGAATGGGCA ATTGATTATA TGAGAGTTTG GAAACCAGTA 
GATGGATATA AAGAGAGTGA AAGTTTAAAT AATTACTTAA TAAGAAATAG ACAAACAGGA 
AAATTCCTTT ATATTGAAGA AAATAATGAT AAAGTGTCTT ATGGGGACAT AACTTTAAAA 
AATGAAAAAA ATGCAAAATG GAGTAAAGAA TATAGAGATG GATACACTTT ATTAAAGAAT 
AATGAAACAG GAGAATATTT AAATATAGAA AACCAAACTG GATATATAGA ACATGGTAAG 
GTTCCAAAAA CTTGGTGGAG TGCTCAATGG AGTGAAGTAC CAGTAGATGG ATATACAAGG 
TTTGTTAACA GATGGAAGCC TAATATGTCA ATACATACAG AAAGTTATGA AGGCGTTTTA 
CAGTATGGAA ATGTTCCAAA TACTTATTGG ACAAGTCAAT GGCAACTTAT TCCTGTAGAA 
TAA

Protein sequence

MFVFMLLLLL PFTISKAKDF PANPIEKAGY KLDFSDEFNG PTLDREKWTD YYLPHWCKDP 
ESAKANYRFE NGSLVEYITE DQKPWCPEHD GTVRSSAIMS FDKSWIHNFS GTTDNHERNE 
WRGYTTKYGY FEIRAKLSNT GGGGHQAWWM VGMQDDTNDW FNSKQTGEID ILETFFSKKD 
TWRIAAYGWN DPNFQTSWTI SEDKVPSGDP TSEYHIYAME WTPTALKFYY DNELFKVIYG 
SPDYEMGTIL NIYTDAGSGV HNDVWPKEWA IDYMRVWKPV DGYKESESLN NYLIRNRQTG 
KFLYIEENND KVSYGDITLK NEKNAKWSKE YRDGYTLLKN NETGEYLNIE NQTGYIEHGK 
VPKTWWSAQW SEVPVDGYTR FVNRWKPNMS IHTESYEGVL QYGNVPNTYW TSQWQLIPVE