Gene CPR_2056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2056
Symbol
ID	4205610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2276192
End bp	2277715
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	24%
IMG OID	642566606
Product	AraC family DNA-binding response regulator
Protein accession	YP_699365
Protein GI	110802788
COG category	[T] Signal transduction mechanisms
COG ID	[COG4753] Response regulator containing CheY-like receiver domain and AraC-type DNA-binding domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACAAGG TTATGCTAGC TGATGATGAG AATTTAATTT TACAAGGACT TGAGAATATA 
ATTGAATGGG AAGAACTAGG GTTAGAAATT GTAAATAAGG CAAGTAATGG TCAAGAAGCC 
ATAGATAAAT TTAAGGAAAA TCCAGTTGAT ATAGTGTTAA CTGATATTAA TATGCCACAG 
GTTACTGGGT TAGAGTTATT AAAGGAATTA AAGAAAATTA ATTCTGATGT TAAGTTTATA 
ATATTAAGTG GATATGATGA TTTTTCTTAT GCTAAGAAAG CAATAGAATT AGGTGTTGAA 
AATTATATAT TAAAGCCTAT AGATGAAGAA GAATTAGAAA AAACTTTAAA AAATACAATA 
AATAAAATAA AACAAGAAAA AGAAGAAAAT AAATCAAGTT TAGGAAAACA TAATATTCTT 
ATTAAACTTA TAAAGGGTAA ATTGGATCAA GGTGAAATAG AGGAAAACAA AGAATGCTTT 
TATATGAATT TAAATTCAGA AAGATATTCT CTATGTATCA TAAATACTAG AAGTAGATAT 
GATAGTGAGG AAATGTTACA TAACATAGTT AATGTAATTA AGGAAAATAC TCAAAATAAC 
TTTGAGATAA TATACACCTT AGATGAAGAA CTTATTTTAA TAAATTCTTG GGATGAAGCC 
TTAAGTAAAA AAGAGATTAA AAAATATTAT GATAAGTTAA AAGAACAAAT AATAAATGAA 
TATGGAATAG ATGTATTTTT AAGTGTTGGA GAACCTATTT GTGATCTTTA TAAAATTAGT 
TCAAGTTATA AGGAAGCAAA TAATTTAAAA AAATATGTTC TTACTTTAGG ATATAATAAG 
TGTATAACAA CAGAGGATGT TGAAGATATA AATGAGAAGA ATATAAACTT TAGTGAGGTT 
TTAGATAAAT TAAATAAAAG AATAATTGCT AAAGATATAG AAGGGGCAGA AAAAATCATT 
GAGGAAACTG TTGAGGATAA AAAGTTAAAT CCAAGAAATA TATATGATTT ATCTGTGAAA 
ATACTATTTT TATTAGATGG TATTGTGGAA GAATTTAAAG TTGAAAAACA ATATACAGGA 
AATAGCTTAG GAGAGGAAAT AGTTGCTCTT TGTAGTGAAG ATACAAGGGA AGATATTAAA 
ACTTTATTAT GTAGTGAAAT TAGGGAAGTT ATAGAACTTA TGCACCCAAC AACCATAAAA 
TATAGCCCTG TAATTCAACA AATAATAAGT TATGTAAATG AAAACTATTA TGAAGAGGTA 
AGTCTTAAGA CTTTAGCTAG AAAATATAAT ATAAATACTT CTTATTTAGG ACAAGTATTT 
ACTAAAGAAG TTGGATGTTC ATTTTCTGAG TATTTAAATA AAACTAAAAA TATGAAAGCT 
AAAGATCTTA TATTAAATAC AAATATGAAG ATAAATGATA TAGCTAAAAA AGTAGGATAT 
TTAGACACTA GTTATTTCTA TAGAAAGTTT AAAAAGTACT ATGGAGTTTG TCCATCAACT 
TTAAGAAATA TAAAAAATTA CTAA

Protein sequence

MYKVMLADDE NLILQGLENI IEWEELGLEI VNKASNGQEA IDKFKENPVD IVLTDINMPQ 
VTGLELLKEL KKINSDVKFI ILSGYDDFSY AKKAIELGVE NYILKPIDEE ELEKTLKNTI 
NKIKQEKEEN KSSLGKHNIL IKLIKGKLDQ GEIEENKECF YMNLNSERYS LCIINTRSRY 
DSEEMLHNIV NVIKENTQNN FEIIYTLDEE LILINSWDEA LSKKEIKKYY DKLKEQIINE 
YGIDVFLSVG EPICDLYKIS SSYKEANNLK KYVLTLGYNK CITTEDVEDI NEKNINFSEV 
LDKLNKRIIA KDIEGAEKII EETVEDKKLN PRNIYDLSVK ILFLLDGIVE EFKVEKQYTG 
NSLGEEIVAL CSEDTREDIK TLLCSEIREV IELMHPTTIK YSPVIQQIIS YVNENYYEEV 
SLKTLARKYN INTSYLGQVF TKEVGCSFSE YLNKTKNMKA KDLILNTNMK INDIAKKVGY 
LDTSYFYRKF KKYYGVCPST LRNIKNY