Gene Cphy_3921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3921
Symbol
ID	5742047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	4817058
End bp	4818356
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	39%
IMG OID	641295037
Product	DNA-directed DNA polymerase
Protein accession	YP_001561007
Protein GI	160882039
COG category	[L] Replication, recombination and repair
COG ID	[COG0389] Nucleotidyltransferase/DNA polymerase involved in DNA repair
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.019973
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTAGAT TTGTCCATAT TTTGAGTGGC AGTGTAGCAA TGCAGGAAAA GATTTTTTTT 
CATATTGATG TTAACTCTGC GTTTCTTAGC TGGGAGGCTG CTTATCGACT TCATGTTTTA 
GGGGAAAGCG TGGACTTGCG AGAAATCCCT TCTGTAATTG GAGGAGATAA AGAAAATAGG 
CATGGAATAG TTTTAGCGAA ATCTACTTCT GCTAAAAAAC TAAAAATTCA CACAGGTGAA 
GCTCTAGGGG CAGCAGTACA AAAATGCCCA AATTTAGTAA TCATTCCACC AAATTACCAA 
AGGTATGTAA AAGCATCAAA ATCATTAATG GAGATTTTAC ACAGGTTTTC TCCGAAAGTA 
GAGCAGTATT CGATTGATGA AGCTTTTGTT GATATGAGTG GGAGTGAATT GTTATATGGG 
GGACCTGTTA TTGTTGCAAA TAATCTAAAA GATTTGATTG AAGAGGAGTT AAAATTTACG 
GTAAATATTG GTGTGTCTTC GAACAAATTA TTAGCAAAGA TGGCAGGGGA GTTAAAGAAG 
CCGAATTTGG TGCATACGAT GTTTCCAGAG GAGATTCCAA AGAAGATGTG GCCGTTACCG 
GTAGGAGAGT TATTTTTTGT AGGAAGAGCG ACAGAAAAAA AACTCTTTAA CCTGGGAATT 
AAGACGATAG GGGAGCTAGC ACAAACAGAT GTAAAAATAT TGAAAGCTCA TTTTGGGAAG 
TATGGGGAAG TACTTTACCA GTTTTCACAT GGAATCGATG AATCCCCCCT TTTTGTTCCT 
TTAGAAGCAA ATAAGGGGTA TGGCAATTCC GTAACGACAC CTTACGATAT TGTTACGATG 
GAGCATGCAA ATCTCGTTTT GCTATCGTTA AGCGAAACAG TATGTACGAG ACTTCGAATG 
GATGGCGTAA AAGGGCAATG TGTGTCTGTT TCGGTTACAA CAGATACTTT TCAGAGGGCC 
TCTCATCAAG GGATGCTTTT TTCGGCTTCT AATACGACGA TGGAGGTATA CCGTTTTGCT 
TGCCGTTTAT TTAAGAATCT ATGGGATGGA AGGACGCCAA TTAGACAAAT GGGCGTGCAC 
ACAAGTAGGA TTACCAAGGA GAGTACGATG CAGTATAACC TATTTGATTG GGATCGCTAT 
GAGAAATTGA GTAAATTGGA TGAAACAATA GATTCTATAC GAAAGAGGTA CGGAGACGAT 
TCTGTGATGA GAGCTTGTTT TTTAAATACA AGTACTTATC ATATGCATGG AGGAATATCA 
AAAGAAAAGA AAACGGGAAT TACAAAGCCG CTGCGGTAG

Protein sequence

MGRFVHILSG SVAMQEKIFF HIDVNSAFLS WEAAYRLHVL GESVDLREIP SVIGGDKENR 
HGIVLAKSTS AKKLKIHTGE ALGAAVQKCP NLVIIPPNYQ RYVKASKSLM EILHRFSPKV 
EQYSIDEAFV DMSGSELLYG GPVIVANNLK DLIEEELKFT VNIGVSSNKL LAKMAGELKK 
PNLVHTMFPE EIPKKMWPLP VGELFFVGRA TEKKLFNLGI KTIGELAQTD VKILKAHFGK 
YGEVLYQFSH GIDESPLFVP LEANKGYGNS VTTPYDIVTM EHANLVLLSL SETVCTRLRM 
DGVKGQCVSV SVTTDTFQRA SHQGMLFSAS NTTMEVYRFA CRLFKNLWDG RTPIRQMGVH 
TSRITKESTM QYNLFDWDRY EKLSKLDETI DSIRKRYGDD SVMRACFLNT STYHMHGGIS 
KEKKTGITKP LR