Gene CPF_0891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0891
Symbol
ID	4203023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1056901
End bp	1058268
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	34%
IMG OID	638081773
Product	ethanolamine ammonia-lyase, large subunit
Protein accession	YP_695340
Protein GI	110801427
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4303] Ethanolamine ammonia-lyase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTTTAA AAACAAAATT ATTTGGAAAA GTCTATGCTT TCAAATCTTT AAATGAGGTT 
ATGGCTAAGG CAAACGAAGA GAAATCAGGA GATAGATTAG CTGGATTAGC AGCAGAGTCT 
TCAGAAGAAA GAGTAGCAGC AAAGGTTGTA TTATCAAATA TAACTTTAGA GGATTTAAGA 
AATAACCCAG CAGTTCCTTA TGAAATAGAT GAGGTAACTA GAATAATTCA AGATGATGTA 
AATGAAAAAA TATACAATGA AATAAAACAT TGGACAGTAT CTGAATTTAG AGAGTGGATA 
TTAGATGAAA ATACAACAGG TGCTGATATT AGAAGAATTT CAAGAGGTTT AACTTCTGAA 
ATGGTAGCAG CTGTAGCAAA ATTAATGTCT AATATGGACT TAATATATGG AGCAAGAAAG 
ATAAAGGTAA CAGCTCACTG TAACACAACA ATAGGTGAAA AGGGAACTTT ATCTGCAAGA 
CTTCAACCAA ACCATCCAAC AGATGATCCA GATGGAATAA TGGCTTCATT ATTAGAAGGA 
TTAACTTTTG GTGTTGGAGA TGCAGTTTTA GGATTAAACC CAGTTGATGA CTCTGTTGAG 
AGTGTTACTA AAGTATTAAA GAGATTTGAT GAAATAAAAA GAAAATTTAA AATACCAACT 
CAAACTTGTG TACTAGCTCA CGTAACAACT CAAATGGAAG CTATAAGACA AGGGGCGCCT 
ACAGACCTAA TATTCCAATC AATAGCAGGT TCTGAAAAGG GAAATGAAGC TTTTGGATTT 
AATGCAGCAA CTATAGAAGA AGCTAGACAA TTAGCTTTAA AACAAGGAAC GGCTACAGGA 
CCAAATGTAA TGTACTTTGA AACAGGACAA GGTTCAGAGC TTTCATCAGA TGCTCACCAT 
GGAGTTGACC AAGTAACTAT GGAAGCTAGA TGTTATGGAT TCGCTAAGAG ATTCCAACCA 
TTCTTAGTTA ACACAGTTGT TGGATTCATA GGACCAGAGT ATTTATATGA TTCAAAACAA 
GTTATAAGAG CAGGTCTTGA AGACCACTTC ATGGGTAAAT TAACAGGAAT ACCAATGGGA 
TGTGATGCAT GTTATACAAA CCACATGAAA GCAGATCAAA ATGATATAGA AAACTTAGCT 
GTATTATTAA CAACAGCAGG ATGTACTTAT TTCATGGGAA TTCCACATGG AGATGACGTA 
ATGCTTAACT ATCAAACTAC AGGATACCAT GAAACAGCAG CTTTAAGAGA AATGTTTGGA 
TTAACAGCTA TTAAAGAGTT CCAAGATTGG TTAGTTGAAA TGGGATTCGT AGACGAAAAT 
GGAAAGCTTA CTAAAAAAGC AGGAGATGCA TCTGTACTTT TAGGATAG

Protein sequence

MILKTKLFGK VYAFKSLNEV MAKANEEKSG DRLAGLAAES SEERVAAKVV LSNITLEDLR 
NNPAVPYEID EVTRIIQDDV NEKIYNEIKH WTVSEFREWI LDENTTGADI RRISRGLTSE 
MVAAVAKLMS NMDLIYGARK IKVTAHCNTT IGEKGTLSAR LQPNHPTDDP DGIMASLLEG 
LTFGVGDAVL GLNPVDDSVE SVTKVLKRFD EIKRKFKIPT QTCVLAHVTT QMEAIRQGAP 
TDLIFQSIAG SEKGNEAFGF NAATIEEARQ LALKQGTATG PNVMYFETGQ GSELSSDAHH 
GVDQVTMEAR CYGFAKRFQP FLVNTVVGFI GPEYLYDSKQ VIRAGLEDHF MGKLTGIPMG 
CDACYTNHMK ADQNDIENLA VLLTTAGCTY FMGIPHGDDV MLNYQTTGYH ETAALREMFG 
LTAIKEFQDW LVEMGFVDEN GKLTKKAGDA SVLLG