Gene Pnap_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_1039
Symbol
ID	4689481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	+
Start bp	1100828
End bp	1101979
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	64%
IMG OID	639834038
Product	basic membrane lipoprotein
Protein accession	YP_981277
Protein GI	121603948
COG category	[R] General function prediction only
COG ID	[COG1744] Uncharacterized ABC-type transport system, periplasmic component/surface lipoprotein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGACC TGCAAAAACG CTCCCTGCTC AAGCTCGCGG CCCTTTCGGC GGTGGCTGCT 
GCGGCCCTGA TGGGTTGCGG CAAGAAAGAG GAGGCCGCGC CCGCGCCTGC GCCCGCACCG 
GCCGCCGCCG CTCCGGCCAA GGCCGAACCC TTGAAAGTCG CCTTTGCCTA TGTCGGCCCG 
GTCGGCGACG GCGGCTGGAC CTATGCCCAT GACAACGGCC GCAAGGCGGT CGAAAAAGAG 
TTCGGTGACA AGGTCGTCAC CAGCTTTGTC GAAAAAGTCC CCGAGTCGGC CGATGCCGAG 
CGCGTGATCC GCGACATGGC GGGGCAGGGC AACCAGCTGA TCTTCGGCAC CACCTTCGGC 
TACATGGAGC CCATGCTCAA GGTCGCCAAT GACTTGAAAG ATGTCAAGTT CGAGCATGCC 
ACCGGCTACA AGACCGCCGC CAACATGCGC ACCTACGACA GCCGCACCTA CGAAGGCGCC 
TACATGGCCG GCGTGGTGGC GGGCAAGATG AGCAAGACCG GCACGCTGGG CGTGGTCGGC 
TCGGTGCCGA TTCCCGAGGT GGTGCGCAAC ATCAACAGCT TCACGCTGGG CGCGCAGTCG 
GTCAACCCGG CGATCAAGAC CAAGGTGGTC TGGGTCAACG AGTGGTTCAA TCCACCAAAA 
GAAACCGAAG CCGCCACCGC GCTGATCAAC GGCGGCGCCG ACGTGCTGTT CCAGAACACC 
GACTCGTCGG CCGTGCTGCA GACTGCCGAG AAAATGGGCA AGCGCGCCTT CGGCTGGGAT 
TCGGACATGA CTGCCTACGG CCCCAAGGCC CACCTGGCTT CGGCCGTGAT CAACTGGGGT 
CCGTACTACA TCAAGGCCGT GGGCGACGCG CTGCAAGGCA AGTGGGCCGG TGGCACAAGC 
GCCTGGTGGG GTGTGAAGGA AGGTGCGATT GACCTGGTGT CCATCGCCGC CGACGTGCCC 
GACGACACCA AAAAGCGCAT CGACGAAGTC AAGGCCGGCC TGAAGGATGG CAGCTTTTCG 
ATCTGGAAAG GCCCGATCAT GGACAACACC GGCAAGGAGT TGCTGGCCAA GGATGTGGTC 
GCCGACGACA AGTTCCTGGG CGGCCTGAAG ACCTACGTCA AGGGCGTCGA AGGCAAGGTT 
CCGGGTAACT GA

Protein sequence

MTDLQKRSLL KLAALSAVAA AALMGCGKKE EAAPAPAPAP AAAAPAKAEP LKVAFAYVGP 
VGDGGWTYAH DNGRKAVEKE FGDKVVTSFV EKVPESADAE RVIRDMAGQG NQLIFGTTFG 
YMEPMLKVAN DLKDVKFEHA TGYKTAANMR TYDSRTYEGA YMAGVVAGKM SKTGTLGVVG 
SVPIPEVVRN INSFTLGAQS VNPAIKTKVV WVNEWFNPPK ETEAATALIN GGADVLFQNT 
DSSAVLQTAE KMGKRAFGWD SDMTAYGPKA HLASAVINWG PYYIKAVGDA LQGKWAGGTS 
AWWGVKEGAI DLVSIAADVP DDTKKRIDEV KAGLKDGSFS IWKGPIMDNT GKELLAKDVV 
ADDKFLGGLK TYVKGVEGKV PGN