Gene CPF_2492 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2492
Symbol
ID	4202485
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2763593
End bp	2764717
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	30%
IMG OID	638083357
Product	putative ethanolamine utilization protein EutH
Protein accession	YP_696906
Protein GI	110798826
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3192] Ethanolamine utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGAGAAAT TAGTGCTTGG TATAATAGGT ATTTTCTTTG TAATTAGTGG ATTTGATTAC 
ATAAATAATA ATAAATTGGG GTTGGGAGAT AAATTTAAAG AGGGAATGAT ATCTATGGGA 
TCAATAGCTA TATCCATGGT AGGGATATAT TCTCTTTCGC CTTTAATAGG AGAAGGCATA 
GGATTCTTAT TAACTCCAAT AAGCAATTTT CTAGGAATTG ATTCATCCAT ATTTCCATCA 
ATGTTTTTAG CTGTAGATAT GGGAGCCTTA GGAATTGCAG AAAGTTTATC ATCAAATATT 
CACATGTATT GGATTTCTGG GGTAATAATA GCTTCGACTT TAGGGGCTAC CATAAGCTTT 
TCTATTCCCT TAGCTTTAGG AATTATAGAG GAGAAGTATC TTGAAGACCT AACAACAGGT 
TTATTATATG GAATAATGAC TTTACCTATA GCGCCAATAG TTGCAGGTTT ATTTTTAGGA 
GTTGATATTA AATTATTACT ATTTAATATT TTGCCATTAA TAATATTTGC TATATTATTA 
GCAGTTTTTA TGAATAAGTT TAAAGATACG ACAGTAAAAT TCTTTATTAA ATTAGGTAAG 
CTTATACAGC TTGTTAGTAT ATTGGGGCTT TTAGTTTTAG GATTTTTATC TATTATAGGA 
ATAAAGCCTA TAGGAAGTAT TTTACCTATA GATGAGGCTT TAAGTGTGGT TGGTAAAATA 
GCTATATTCT TAGGAGGAGC ATATCCTTTA ATTAATTTTA TAACAGAAAA GTTTTCAAAG 
GTCTTAAGTA AAATAGGAGA AAAGATAAAT ATAGATGAGT TTTCTATTGC GGCTTTTTTA 
GGAACTCTTG CTTCAAATAT AATATTATTC CAAAGTTTTA ATAAGATGAG CTCTAAGGGA 
AGAATAGCCT TAACTGCCTT TAGTGTAAGT GGAGCCTTTG TAATTGGAGG ACAGCTAGGT 
TTTGTATCTC TTAAGACACC TGAGATTATA AATATTTATA TAGCATCAAA ATTAATAGCT 
GGTATAACTG CCATGGTTGT AGCTTTAATA GTACATAGAA AGACAGAAGA AAACTTAAAT 
GATGAAAGTC AAAGTGAAGA AAATATTCCA GTTTTAGAAT CTTAA

Protein sequence

MEKLVLGIIG IFFVISGFDY INNNKLGLGD KFKEGMISMG SIAISMVGIY SLSPLIGEGI 
GFLLTPISNF LGIDSSIFPS MFLAVDMGAL GIAESLSSNI HMYWISGVII ASTLGATISF 
SIPLALGIIE EKYLEDLTTG LLYGIMTLPI APIVAGLFLG VDIKLLLFNI LPLIIFAILL 
AVFMNKFKDT TVKFFIKLGK LIQLVSILGL LVLGFLSIIG IKPIGSILPI DEALSVVGKI 
AIFLGGAYPL INFITEKFSK VLSKIGEKIN IDEFSIAAFL GTLASNIILF QSFNKMSSKG 
RIALTAFSVS GAFVIGGQLG FVSLKTPEII NIYIASKLIA GITAMVVALI VHRKTEENLN 
DESQSEENIP VLES