Gene Pnap_4030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_4030
Symbol
ID	4689442
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	-
Start bp	4296168
End bp	4297205
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	69%
IMG OID	639837044
Product	biotin synthase
Protein accession	YP_984243
Protein GI	121606914
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.959642
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCCA TCACCACCAT TCCCCTGTCC ACGCTGCGTT CCTCCCTGCC GGCCCGCCCG 
GATGCCGCCG CCGCGCCGCA GCGCTGGCGC GTCGCCGACA TCGAAGCCCT GTACGCCTTG 
CCCTTCATGG ACCTGCTGTT TCGCGCCCAG CAGGTGCACC GCGCGAACTT CGACGCCAAC 
CAGGTGCAGC TCTCGACGCT GCTGTCGATC AAGACCGGCG GCTGCGCCGA GGACTGCGGC 
TACTGCCCGC AATCGTCCCA TTTCGAAACC GAGGTGAAGG CCAGCAAGCT GATGGCGCTC 
GACGAGGTGA TGGCCGCCGC GCAGGCCGCC AAGGACCAGG GCGCGACGCG CTTTTGCATG 
GGCGCGGCCT GGAGCCGCCC GAAAGAGCGC GACATGGAGC GCGTCACCGA GATGGTGCGC 
GAAGTGCGCG GCCTGGGGCT GGAAACCTGC ATGACGCTGG GCATGCTGGA GGCCGAGCAG 
GCGCAGGCCT TGAAAGACGC GGGCCTCGAC TACTACAACC ACAACCTCGA CAGCTCGCCC 
GAGTTCTACG GCAGCATCAT CAGCACCCGC ACCTACCAGG ACCGGCTCGA CACGCTGGAG 
AATGTGCGCG GCGCGGGCAT CAACGTCTGC TGCGGCGGCA TTGTCGGCAT GGGCGAAAGC 
CGTGCGCAGC GCGCCGGGCT GGTCGCGCAG CTGGCCAACC TGGAGCCGTA TCCGGAGTCG 
GTGCCGATCA ACAACCTGGT GGCGGTCGAA GGCACGCCGC TGGCCGACAC GCCGCCGCTG 
GACCCGTTCG AGTTCGTTCG CACGATTGCC GTGGCGCGCA TCACCATGCC GCGCACCATG 
GTCCGGCTGT CGGCCGGGCG CGAGCAGATG GATGAAGCCC TGCAGGCGCT GTGCTTCATG 
GCCGGCGCCA ACTCGATCTT CTACGGCGAC CGGCTGCTGA CCACCAGCAA CCCGCAGGCC 
GACAAGGACC GCCAGCTGTT CGCGCGCCTG GGCCTGAAGG TGCAGGGCGA GCGCCCCGCC 
GCCACGGTGC AAGGCTGA

Protein sequence

MTSITTIPLS TLRSSLPARP DAAAAPQRWR VADIEALYAL PFMDLLFRAQ QVHRANFDAN 
QVQLSTLLSI KTGGCAEDCG YCPQSSHFET EVKASKLMAL DEVMAAAQAA KDQGATRFCM 
GAAWSRPKER DMERVTEMVR EVRGLGLETC MTLGMLEAEQ AQALKDAGLD YYNHNLDSSP 
EFYGSIISTR TYQDRLDTLE NVRGAGINVC CGGIVGMGES RAQRAGLVAQ LANLEPYPES 
VPINNLVAVE GTPLADTPPL DPFEFVRTIA VARITMPRTM VRLSAGREQM DEALQALCFM 
AGANSIFYGD RLLTTSNPQA DKDRQLFARL GLKVQGERPA ATVQG