Gene CPR_1904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1904
Symbol
ID	4204754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2102128
End bp	2104308
Gene Length	2181 bp
Protein Length	726 aa
Translation table	11
GC content	30%
IMG OID	642566454
Product	GTP pyrophosphokinase
Protein accession	YP_699214
Protein GI	110802270
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG0317] Guanosine polyphosphate pyrophosphohydrolases/synthetases
TIGRFAM ID	[TIGR00691] (p)ppGpp synthetase, RelA/SpoT family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAGAAG AACTAATTTC TAAAATAAAA GCTAATGGGA ATAATGTTGA TATAGATTTA 
GTTAAAAAAG CATATGATTT AGCTTTTGAA GCACATAAAG AACAAAAAAG AGAATCAGGA 
GAACCATACA TAACTCATCC TATTAGTGTA GCTATGATAT TAGCTGATAT GGGAATGGAT 
ACAAATACTA TAGTTGCAGG ACTTCTTCAT GATGTAATAG AGGATACGGA TTATACTTAT 
GAAGATATAA GTAATATTTT TAATGTTGAA GTAGCTAATT TAGTCGATGG AGTTACTAAG 
CTTGGAAAAA TAAAATATAA AAGCAAAGAA GAACAACAAG CTGACAATGT AAGAAAAATG 
CTTTTAGCAA TGGCTAAAGA CATAAGGGTT ATAATAATAA AACTAGCAGA TAGACTTCAT 
AATATGAGAA CACTTAAATA TATGAAGCCT GAAAAACAAA AGAAAAAAGC TCAAGAAACT 
TTAGATATAT TTGCACCCTT AGCTCATAGA CTGGGTATAT CTAAAATAAA GTGGGAGTTA 
GAAGATTTGT GTTTAAGATA TATTCATCCA GAAGAATATT ATGACTTAGT AAATATGATA 
GCTGAAAAAA GGGTGGAGAG AGAAAAATTT ATTTCTCGTA TAATTAAAGA GCTAAAAGAA 
AATTTAGATA AAGCTAACAT AGATAGCGAT ATAGAAGGAA GACCAAAACA TTTCTACAGT 
ATATATAGAA AAATGGTGAA TAAACATAAG AGCATAGAAC AAATCTTTGA TTTAACAGCT 
ATAAGGATTT TAGTTAATAC GGTTAAAGAT TGCTATGCAG TACTAGGTAT AGTACACACT 
ATTTATAAGC CAATACCAGG TAGATTTAAA GATTATATAG CAATGCCAAA ACCTAATATG 
TATCAATCTT TACATACAAC AGTAATAGGA AGCGAAGGAA AGACTTTTGA AATTCAAATA 
AGAACTTTTG AAATGCATAG AACGGCTGAG TACGGAATAG CAGCTCATTG GAAATATAAG 
AGTGGTATTA ATGGCACTGA TTCAAAAGAT ATGACTTTTG AAAATAAGTT AACATGGCTT 
AGAGATATAC TTGAGTGGCA AAAGGAAGCT GTTGATGCAA CTGAGTTTAT GGAAGGGTTT 
AAACTTGACT TATTCTCAGA TGAAATATTT GTATTTACTC CTAAGGGAGT AGTTATAAAT 
TTGCCAGTGG GAGCAACTCC CTTAGACTTT GCATATAAGA TCCATACAGA TATAGGAAAT 
AAATGCGTAG GAGCTAAAGT AAACGGAAAG ATAGTAACTC TAGATTACAA GCTTAAAACT 
GGGGAAATAG TAGAGATATT AACATCCTCA TCATCTAGAG GACCTAATAT AGACTGGTTA 
AATATAGCTA ATAGCAATCA AGCTAGAAGT AAAATAAAGC AATGGCTTAG AAAAGCAAGA 
AGAGAAGAGA ATTTAGAAAG AGGAAAGGAA ATGCTTGATA AGGAATGTAA AAAGCAATCC 
TTAGTATTTT CAGATCTTTG CAAAGGGCCA TTATATGATA AATTATTAAA GAGATATCAT 
TTAAATAATG TTGAAGAAAT ATATGTAGCT ATAGGAGAAG GAGAGTTACT TTCATCTACT 
GTAATATCTA AGCTTAAAGA GAATATTGTA AAACAGGTTG CTGAAGAGGA ATTAAATAAG 
AATATTGAAG AACAAATAGC TAAAACTGAA AGACAAATAA AGAAAAAACA AAACTATGGA 
GTAACTGTTA AGGGATTAAA TAATATAATG GTTAGATTTG CAAGGTGTTG TAATCCTGTA 
CCTGGAGATG ATATAGCTGG GTATATAACT AAGGGAAGAG GAGTTTCTGT ACATAGAAAA 
GACTGTTCTA ATTTTAAAGC TATAGTAGAA AAACAAGAAG AGAAAGTTGT AGATGTTAGT 
TGGGGAACTG AAAAGGGAGC TGCATATGTT GCTGAACTTG AGGTTAAAGC AGAAGATAGA 
ATGTGTTTAT TATCTGATGT TATGTTAGTT ATAACTGACT CTAATTTTAG ACTACTTTCT 
TTAAATGCTA AATCAGGTAG AAATGGAGTA GCAAATATAA ATATTCAAGT AAAGATTGAT 
AATATAGAAC AATTAAAAGA ATTAATGAAG AAAATAAGAA GACTACAAGG AATATTAGAT 
GTTTATAGAG TAAATAAATA A

Protein sequence

MLEELISKIK ANGNNVDIDL VKKAYDLAFE AHKEQKRESG EPYITHPISV AMILADMGMD 
TNTIVAGLLH DVIEDTDYTY EDISNIFNVE VANLVDGVTK LGKIKYKSKE EQQADNVRKM 
LLAMAKDIRV IIIKLADRLH NMRTLKYMKP EKQKKKAQET LDIFAPLAHR LGISKIKWEL 
EDLCLRYIHP EEYYDLVNMI AEKRVEREKF ISRIIKELKE NLDKANIDSD IEGRPKHFYS 
IYRKMVNKHK SIEQIFDLTA IRILVNTVKD CYAVLGIVHT IYKPIPGRFK DYIAMPKPNM 
YQSLHTTVIG SEGKTFEIQI RTFEMHRTAE YGIAAHWKYK SGINGTDSKD MTFENKLTWL 
RDILEWQKEA VDATEFMEGF KLDLFSDEIF VFTPKGVVIN LPVGATPLDF AYKIHTDIGN 
KCVGAKVNGK IVTLDYKLKT GEIVEILTSS SSRGPNIDWL NIANSNQARS KIKQWLRKAR 
REENLERGKE MLDKECKKQS LVFSDLCKGP LYDKLLKRYH LNNVEEIYVA IGEGELLSST 
VISKLKENIV KQVAEEELNK NIEEQIAKTE RQIKKKQNYG VTVKGLNNIM VRFARCCNPV 
PGDDIAGYIT KGRGVSVHRK DCSNFKAIVE KQEEKVVDVS WGTEKGAAYV AELEVKAEDR 
MCLLSDVMLV ITDSNFRLLS LNAKSGRNGV ANINIQVKID NIEQLKELMK KIRRLQGILD 
VYRVNK