Gene Pnap_2012 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_2012
Symbol
ID	4689359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	-
Start bp	2138112
End bp	2139632
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	60%
IMG OID	639835020
Product	NusA antitermination factor
Protein accession	YP_982242
Protein GI	121604913
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA [TIGR01954] transcription termination factor NusA, C-terminal duplication

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000880424
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.51664
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCGCG AACTGTTGAT GTTGGTTGAT GCCATCTCGC GTGAAAAAAA CGTTGAACGC 
GACGTCGTCT TTGGCGCCGT CGAGCTTGCG CTCGCCTCTG CCACCAAGAA AGTGTATGCC 
GATGGCGTGG ACATCCGTGT TGCGGTTGAC CGTGACAGCG GAAATTACGA AACCTTCCGC 
CGCTGGCTGG TGGTTGCTGA CGAGGCTGGT CTGCAAAATC CCGAAGCCGA AGAGCTGGTG 
ACCGATGCGC GCGACGAAAT CCCCGACATT GAAGAGGGCG ACTACATCGA AAAGCCGGTC 
GAAAGCCTGC CGATTGGCCG CATTGGCGCG CAGGCGGCCA AGCAGGTCAT CCTGCAAAAA 
ATCCGCGACG CCGAGCGCGA AATGCTGCTC AACGACTTCA TGTCGCGCGG TGACAAGATT 
TTTGTCGGCA CCGTCAAGCG CATGGACAAG GGCGACCTGA TCGTCGAATC CGGCCGCGTC 
GAGGGCCGTC TGCGCCGCAG CGACATGATT CCGAAAGAAA ACCTGCGCAC TGGCGACCGT 
GTCCGCGCCA TGATCATGGA AGTCGATACC ACGCTGCGTG GCGCTCCCAT CATCCTGTCA 
CGCACTTCGC CCGAGTACAT GATCGAGCTG TTCCGCCAGG AAGTCCCTGA AATCGAGCAG 
GGCCTGCTTG AAATCAAGAC CTGCGCGCGC GACCCCGGCT CACGCGCCAA GATCGCCGTG 
CTGTCGCATG ACAAGCGTGT CGATCCGATT GGCACCTGCG TCGGCGTTCG CGGCACCCGC 
GTCAATGGCG TGACCAACGA GTTGGCTGGC GAACGCGTCG ATATCGTGCT GTGGAGCGAA 
GACCCGGCCC AGTTCGTGAT CGGTGCGCTG GCGCCCGCCA ATGTGTCGTC CATCGTGGTC 
GATGAAGAGC GTCACGCGAT GGACGTGGTG GTGGATGAGG AAAACCTCGC CATCGCCATT 
GGCCGTGGCG GCCAGAACGT GCGCCTGGCG TCCGAGCTGA CCGGCTGGAA GATCAACATC 
ATGGATGCCA ACGAGTCCGC CCAGAAGCAG GCCACCGAAA CCGACAGCAG CCGCAAGCTG 
TTCATGGCCA AGCTCGATGT GGACCAGGAA ATCGCCGACA TCCTGATTGC CGAGGGCTTT 
ACCAGCCTGG AAGAAGTGGC CTATGTGCCG CTGCAGGAAA TGCTCGAAAT CGAATCTTTC 
GATGAAGATA CCGTCAACGA GCTGCGCACA CGCGCCAAAG ACGCTCTTTT GACCATGGAA 
ATCGCCCAGG AAGAAAATGT CGGCGGTGTT TCGCAGAATC TGCGCGACGT TGAAGGCTTG 
ACGCCCGAGT TGATTGCCAA ATTGACCGAA GCGGGTGTTG CCACCCGCGA CGACCTGGCC 
GATCTGGCCG TGGATGAGCT TACCGATATA ACCGGCCAGT CTGCGGACGA GGCCAAAGCC 
CTGATCATGA CTGCACGCGC CCATTGGTTT ACCGATGGCG CTGGCGACGC TGCTGCACCC 
GCAGCAGCCC AAGAGCAGTG A

Protein sequence

MNRELLMLVD AISREKNVER DVVFGAVELA LASATKKVYA DGVDIRVAVD RDSGNYETFR 
RWLVVADEAG LQNPEAEELV TDARDEIPDI EEGDYIEKPV ESLPIGRIGA QAAKQVILQK 
IRDAEREMLL NDFMSRGDKI FVGTVKRMDK GDLIVESGRV EGRLRRSDMI PKENLRTGDR 
VRAMIMEVDT TLRGAPIILS RTSPEYMIEL FRQEVPEIEQ GLLEIKTCAR DPGSRAKIAV 
LSHDKRVDPI GTCVGVRGTR VNGVTNELAG ERVDIVLWSE DPAQFVIGAL APANVSSIVV 
DEERHAMDVV VDEENLAIAI GRGGQNVRLA SELTGWKINI MDANESAQKQ ATETDSSRKL 
FMAKLDVDQE IADILIAEGF TSLEEVAYVP LQEMLEIESF DEDTVNELRT RAKDALLTME 
IAQEENVGGV SQNLRDVEGL TPELIAKLTE AGVATRDDLA DLAVDELTDI TGQSADEAKA 
LIMTARAHWF TDGAGDAAAP AAAQEQ