Gene Pden_2944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pden_2944
Symbol
ID	4581511
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Paracoccus denitrificans PD1222
Kingdom	Bacteria
Replicon accession	NC_008687
Strand	+
Start bp	111383
End bp	113182
Gene Length	1800 bp
Protein Length	599 aa
Translation table	11
GC content	68%
IMG OID	639770271
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_916724
Protein GI	119385669
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.858401
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGA CCATCCCGCA AATCACCACC GGCCCGCTGC CCGGATCGCG CAAGATCCAT 
GTGCCGGGCA GCCTGCACGA CATCCGCGTG CCCATGCGCG AGATCGCCGT CTCGAACGAG 
CCGCCGCTGG TCGTCTATGA CAGCTCCGGC CCCTATACCG ACGCGGCGGT GCAGGCCGAC 
ATCGCCCGCG GCCTGCCGGA CCTGCGCGGC GACTGGCAGC TGCGGCGCGG CGACGTGGCG 
CCCTATCCCG GCCGGCAGGT CACCGCCGCC GACAACGGCT TTGCCGAGGG CGCGCGGCTG 
ACCCCCGCCT TTCCGCTGCG CCGCGATCCC CTGCGCGCGG CGGCGGGCCG GGCGGTGACG 
CAGCTGGCCT ATGCCCGCGC CGGCATCGTC ACCCCCGAGA TGGAGTTCGC GGCCATCCGC 
GAGAACGAGG GGCGGCTGGT CGCCCATGCC CGCGACGGCG CGCCGATGGG GGCCGAGCTG 
CCCGATCTGG TGACGCCGGA ATTCGTGCGG GCCGAGATCG CCGCCGGCCG CGCCATCATC 
CCGGCCAACA TCAACCACCG CGAGTTGGAG CCGATGATCA TCGGCCGCAA TTTCAAGGTC 
AAGATCAACG CCAATATCGG CAACTCCGCC GTCACCTCCA GCATGGAGGA GGAGGTCGAG 
AAGATGGTCT GGGCGATCCG CTGGGGCGCG GACACGGTGA TGGACCTGTC CACCGGCCGC 
AACATCCACA ACATCCGCGA CTGGATCATC CGCAACGCGC CGGTGCCCAT CGGCACCGTG 
CCGCTGTATC AGGCGCTGGA GAAGGTCGGC GGCGTGGCCG AGGATCTGAG CTGGGAGGTG 
TTTCGGGACA CGCTGGTCGA ACAGGCCGAG CAGGGCGTGG ACTATTTCAC CATCCATGCC 
GGGGTGCGGC TGCACATGAT CCCGCTGACC GCGCGGCGGG TGACGGGGAT CGTCAGCCGC 
GGCGGCTCGA TCATGGCGAA ATGGTGCCTG CACCACCACC GCGAGAGCTT CCTGTATGAG 
CGCTTCGACG AGATCTGCGA GATCATGCAG GCCTATGACG TCAGCTTCAG CCTGGGCGAC 
GGGCTGCGTC CCGGCTCGAT CGCCGATGCC AATGACGAGG CGCAATGCGC CGAACTGCGC 
ACCCTGGGCG AGCTGACGAA GATCGCCTGG GCCCGGGATT GCCAGGTGAT GATCGAGGGG 
CCGGGCCATG TGCCGATGCA CAAGATCAAG GCCAATATGG AGGAGCAGCT GCGGCATTGC 
CACGAGGCGC CGTTCTATAC GCTTGGCCCG CTGACCACCG ATATCGCACC GGGCTACGAC 
CACATCACCT CGGCCATCGG GGCGGCGATG ATCGGCTGGT TCGGCACGGC GATGCTGTGC 
TATGTCACGC CCAAGGAGCA TCTGGGCCTG CCCGACCGCG ACGACGTCAA GACCGGCGTC 
ATCACCTACA AGCTGGCCGC CCATGCCGCC GATCTGGCCA AGGGCCATCC CGGGGCGCAG 
CGGCGCGACG ATGCGCTGTC GCGCGCGCGG TTCGAGTTCC GCTGGCAGGA CCAGTTCAAC 
CTGGGCCTGG ACCCGGACAC CGCGCAGGCC ATGCATGACG AGACCCTGCC GAAAGAGGCG 
CACAAGCTGG CGCATTTCTG TTCGATGTGC GGGCCGAAGT TCTGCTCGAT GCGGATCTCG 
CACGACATCC GGGCCGAGGC TGAAAAGCAG GCCGGCATGG CGCGCATGGC CGAGAAGTTC 
CGCGAGGGCG GGGCGCTTTA CCTGCCGGTT GCGGAAAGCG TGGCGGAGGC GGCCGATTGA

Protein sequence

MSQTIPQITT GPLPGSRKIH VPGSLHDIRV PMREIAVSNE PPLVVYDSSG PYTDAAVQAD 
IARGLPDLRG DWQLRRGDVA PYPGRQVTAA DNGFAEGARL TPAFPLRRDP LRAAAGRAVT 
QLAYARAGIV TPEMEFAAIR ENEGRLVAHA RDGAPMGAEL PDLVTPEFVR AEIAAGRAII 
PANINHRELE PMIIGRNFKV KINANIGNSA VTSSMEEEVE KMVWAIRWGA DTVMDLSTGR 
NIHNIRDWII RNAPVPIGTV PLYQALEKVG GVAEDLSWEV FRDTLVEQAE QGVDYFTIHA 
GVRLHMIPLT ARRVTGIVSR GGSIMAKWCL HHHRESFLYE RFDEICEIMQ AYDVSFSLGD 
GLRPGSIADA NDEAQCAELR TLGELTKIAW ARDCQVMIEG PGHVPMHKIK ANMEEQLRHC 
HEAPFYTLGP LTTDIAPGYD HITSAIGAAM IGWFGTAMLC YVTPKEHLGL PDRDDVKTGV 
ITYKLAAHAA DLAKGHPGAQ RRDDALSRAR FEFRWQDQFN LGLDPDTAQA MHDETLPKEA 
HKLAHFCSMC GPKFCSMRIS HDIRAEAEKQ AGMARMAEKF REGGALYLPV AESVAEAAD