Gene Pnap_0019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_0019
Symbol
ID	4687094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	+
Start bp	16663
End bp	18579
Gene Length	1917 bp
Protein Length	638 aa
Translation table	11
GC content	64%
IMG OID	639833013
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_980266
Protein GI	121602937
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.691133
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.432221
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAAA CCAATCTTTC CGTCGATGCA GCGGACCTGA CCAGCCGCAT CACCCGCACG 
CCTTTTCCGG GTTCGCGCAA GATCTACATC GAAGGCTCGC GCCCCGACAT CCGCGTGCCG 
TTTCGCGAAG TCACGCTCAC CGACACGCTG GTGGCCGAAG GCAGTGAAAC CCGCCGCGAG 
GCCAATCCGC CGCTGCGCCT GTTCGACTCG TCGGGCGTGT ACACCGACCC GGCAGCAAGC 
ATCGACATCA CGCGCGGCCT GTCTCCGCTG CGCGGCGCCT GGATCAACGA GCGCCAGGAC 
ACCGAAGCCC TGCCCGGCAT CAGCAGCGCC TACGGCCGCG AGCGCCTGAA CGACCCGGCC 
CTCAGCGCGC TGCGCATGGC CCACGCGCCC GTGCCGCGCC GCGCCAAGGC GGGCGCCAAC 
GTGTCGCAGA TGCATTACGC GCGCCAGGGC ATCATCACGC CGGAGATGGA ATACATCGCG 
ATCCGCGAAA ACCTGGTGCG CGCCCAGCTT GCCGAACGCC TGGCGACCGA GCGCGTGCCG 
AAAACCGGCC ATTCGTTCGG CGCGTCGATT CCGAAAGACA TCACCGCCGA ATTCGTTCGC 
GACGAAGTGG CGCGCGGCCG CGCCGTGATT CCGAACAACA TCAACCACCC CGAAACCGAG 
CCGATGATCA TCGGCCGCAA CTTCCTGATC AAGGTCAACG CCAACATCGG CAACTCGGCC 
GTCACCTCGT CGATTGAAGA GGAGGTGGAC AAGCTGGCCT GGTCGATCCG CTGGGGGGCC 
GACACCGTGA TGGACCTCTC GACCGGCGAG AACATCCACG AAACCCGCGA ATGGATTCTG 
CGCAATTCGC CGGTGCCGAT TGGCACGGTG CCGATTTACC AGGCGCTGGA AAAAGTCAAC 
GGCAAGGCCG AAGACCTGAC CTGGGAAATC TTCCGCGACA CGTTGATCGA GCAGGCCGAG 
CAGGGCGTGG ACTATTTCAC CATCCACGCC GGCGTGCGCC TGGCCTATGT GCCGCTGACC 
GCGAACCGCC TGACCGGCAT CGTCTCGCGC GGCGGCTCGA TCATGGCGAA ATGGTGTTTG 
TCGCACCACA AGGAAAGCTT TTTGTACGAG CATTTCGAGG AGATTTGCGA AATCATGAAG 
GCCTACGACG TCTGCTTCTC GCTCGGCGAC GGCCTGCGCC CCGGCTCGAT TGCCGACGCC 
AATGACGAAG CGCAGTTCGC CGAACTGCAC ACGCTGGGCG AACTCACGCA GATCGCCTGG 
AAGCACGACG TTCAGGTGAT GATCGAAGGC CCCGGCCATG TGCCGCTGCA GCTGGTCAAG 
GAAAACGTCG AGAAGCAACT CGAAGCCTGC TTTGAAGCGC CGTTCTACAC GCTTGGCCCC 
TTGATCACCG ACATCTCGCC CGGCTACGAC CATATTTCGT CGGCGATGGG CGCGGCGAAT 
ATCGGCTGGT ACGGCACGGC CATGCTGTGC TACGTGACGC CCAAGGAGCA TCTGGGCCTG 
CCGAACCGCG ACGACGTGAA GCAGGGCCTG ATCGCCTACA AGATCGCCGC GCATGCGGGC 
GACCTGGCCA AGGGCTACCC GGGCGCGCAG ATGTGGGACA ACGCGGTCAG CAAGGCGCGC 
TTCGAGTTCC GCTGGGAAGA CCAGTTCCGC CTGGCGATTG ACCCCGACAC GGCGATGGCC 
TACCACGATG AAACGCTGCC CAAGGAAAAC GCCAAGGTGG CGCATTTCTG CTCGATGTGC 
GGGCCGAAGT TCTGCTCGAT GAAGATTTCG CAGGAAGTGC GCGAGTTTGC GCGGCTGAAT 
CCGTCCACCA CGACGCTGGC CAAGGCGCCG GGCGTGATTC CGATCCAGCA GGTCAGCAGC 
GGCTTCGAGG AAAAAGCCGA GGAGTTCCGC AAGGGCGGGA ACGAGATTTA CTCCTGA

Protein sequence

MAKTNLSVDA ADLTSRITRT PFPGSRKIYI EGSRPDIRVP FREVTLTDTL VAEGSETRRE 
ANPPLRLFDS SGVYTDPAAS IDITRGLSPL RGAWINERQD TEALPGISSA YGRERLNDPA 
LSALRMAHAP VPRRAKAGAN VSQMHYARQG IITPEMEYIA IRENLVRAQL AERLATERVP 
KTGHSFGASI PKDITAEFVR DEVARGRAVI PNNINHPETE PMIIGRNFLI KVNANIGNSA 
VTSSIEEEVD KLAWSIRWGA DTVMDLSTGE NIHETREWIL RNSPVPIGTV PIYQALEKVN 
GKAEDLTWEI FRDTLIEQAE QGVDYFTIHA GVRLAYVPLT ANRLTGIVSR GGSIMAKWCL 
SHHKESFLYE HFEEICEIMK AYDVCFSLGD GLRPGSIADA NDEAQFAELH TLGELTQIAW 
KHDVQVMIEG PGHVPLQLVK ENVEKQLEAC FEAPFYTLGP LITDISPGYD HISSAMGAAN 
IGWYGTAMLC YVTPKEHLGL PNRDDVKQGL IAYKIAAHAG DLAKGYPGAQ MWDNAVSKAR 
FEFRWEDQFR LAIDPDTAMA YHDETLPKEN AKVAHFCSMC GPKFCSMKIS QEVREFARLN 
PSTTTLAKAP GVIPIQQVSS GFEEKAEEFR KGGNEIYS