Gene CPF_2212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2212
Symbol
ID	4202735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2457892
End bp	2459298
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	27%
IMG OID	638083077
Product	GntR family transcriptional regulator
Protein accession	YP_696636
Protein GI	110798608
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAAT TTAGTGTGGT TTTTAAAGAG GGTTTATGTA AATACTTAAT AATATACGAT 
AATATTAAAA GTTTAATTGA AAATGGGAAA ATATCAGAAG GAGAAAAGTT ACCAACTATA 
AGAGAACTAG CAGACTTTTT AGAAGTTAAT AAGGTAACTG TTATTAATGC TTATAAAAAG 
CTTGTACAAG AAGGATATGC ATATCAAGCT CAAGGAAGTG GAACTTATGC TAAAAATAAG 
GATGTAGGAA AAAGTTTTAA GCATGATTAT AATGATTTAT TTAGAAAAAT AGCCTCTGGA 
GATTTGAAGA ATTGGATAGA CTTTACTGGA GAAACTACTA GTGCAAACTT CTTCCAAGTA 
GAAAAACTTA AGAAAGTTTT AGATAATGTA TTAGTTAGAG ATGGTGTAGA GGCATTAATG 
TATAGTGACC CTTTAGGATA TTTAGAATTA AGAAGAAGTA TAAATGAAGA GTTCTGGAAT 
GGAAAAAATA ATTTAGATAA TATACTTATA ATTTCTGGAG CACAACAAGG TATTGATATT 
GTAGGTAAGT CCTTAGTAAA TATAAATGAT AATATTGTAA TAGAAAGGCC AACTTATGGA 
GGAGCACTTT TAGTATTTAA GCTTAGAAGA GCAAATATAT TAGAAATTCC AATGGAGAAG 
GATGGTCCTA ATATTGAAAA GTTTGAAAAT TTATTAAAGA GAAATAAAAT AAAGTGTTTT 
TATACTATGA GCTATTTTCA GAACCCTACA GGTATAAGTT GTTCTTTAGA AAAAAAGAAA 
AGAATAATAG AGCTAGCACA TAAATATGAT TTTTACATAC TAGAAGATGA TTATCTTTCA 
GAATTAGTTT ATTCTAATGA TTTAGAGTAT ATACCATATA GGAGTTTAGA TTCTGAGAGA 
GTTATATATA TAAAAAGTTT CTCTAAAATA TTTCTACCAG GTATAAGAAT GGGATATTTA 
ATAGCACCAG ATAAATTTAA AGAGGAATTT CAAGCTTTAA AATTTAACAC TGATATAGCT 
ACCTCAAGTT TAATGCAAAG AGCTCTTCAG GATTACATTG TAAAGGGATA TTGGAAAGAG 
CATATAGAAA GATTAAATGA GGAATATTCA AAGAGATATA ATTTTATAAA AGAACTTATA 
GATAATAAAT TAGGAGATAT GGTTTCTTAT AGAGAGCCTA AGGGCGGACT TAATTTATTC 
TTAAATATAA ATAAGAACAT AGGCATAACT TCTAAAAAGT TATTTTATGA ACTGAAAGAT 
AGACAAACTA TAATTACTCC AGGAAGCATA TTTTTTAAAA ATCCTAATGA TGGAGATAAA 
AGCTTTAGAA TTGGATTTTC CCAAATAGAT TATAGTAAGA TAGAAAAAGG AATAGATAAT 
ATATACGATG TATTAAAAGG TAGGTAG

Protein sequence

MNKFSVVFKE GLCKYLIIYD NIKSLIENGK ISEGEKLPTI RELADFLEVN KVTVINAYKK 
LVQEGYAYQA QGSGTYAKNK DVGKSFKHDY NDLFRKIASG DLKNWIDFTG ETTSANFFQV 
EKLKKVLDNV LVRDGVEALM YSDPLGYLEL RRSINEEFWN GKNNLDNILI ISGAQQGIDI 
VGKSLVNIND NIVIERPTYG GALLVFKLRR ANILEIPMEK DGPNIEKFEN LLKRNKIKCF 
YTMSYFQNPT GISCSLEKKK RIIELAHKYD FYILEDDYLS ELVYSNDLEY IPYRSLDSER 
VIYIKSFSKI FLPGIRMGYL IAPDKFKEEF QALKFNTDIA TSSLMQRALQ DYIVKGYWKE 
HIERLNEEYS KRYNFIKELI DNKLGDMVSY REPKGGLNLF LNINKNIGIT SKKLFYELKD 
RQTIITPGSI FFKNPNDGDK SFRIGFSQID YSKIEKGIDN IYDVLKGR