Gene PP_2004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PP_2004
Symbol
ID	1042999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas putida KT2440
Kingdom	Bacteria
Replicon accession	NC_002947
Strand	-
Start bp	2273323
End bp	2274363
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	67%
IMG OID	637145418
Product	AraC family transcriptional regulator
Protein accession	NP_744154
Protein GI	26988729
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.46761
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCGCC CCCGCGTGCG CCTGGGCGAA CTGTCGGTTG GTTTTGTCCA GCCTTTGAGC 
GAAGCCCTGC GCGAGCTGGG CCACGACCCT GAACCATTGC TGCGCCGCTA CGGCCTGGAC 
GCGACCCGCC TGAGCGAAGC CGGCGCACGC CTGTCCATAC CCCGCTACAT GCACATGGGC 
CACGCAGCCA TCGAAATGAG CGGTGAGGCC GCTTTAGGTC TGCGTATGGG GCGCCTCAGC 
CGGCTGGCGC ATACGGGCCT GGCCGGGGTC ACTGCGGCCC AGGCCCCCAC CCTGGGCGAG 
GCCGCGCGTA CCCTGCTGCG TTTCGAGCCG CTTTACGCGG CCAACTACCG CGGCCATTCC 
CGCTTTGAGG AAGATGCCCA GGGCGCCTGG CTGCGCTTCT ATTCCATCAG CCCCTACAAC 
GACTACAACC GCTTTGTGGT CGACTCACTG CTGGCCGGCT GGCTGGCCCA GTTGGCCGAG 
CTGGCCGGCA CCCCGGTGCA GGCCGAACGC CTGGAGATCG AGTTTGCCGC GCCCTCCTAT 
GCCGCGCGCT ATCAACCGCT TTGCAGCACG CCTGTGCAGT TCGCCGCCGA CGGCAATCAG 
CTGCGTCTGA GCCGCGCTAC CTTGCAACTG GCCAACCCCG GGCATTGCCC GAGTACCTGG 
CAGCACCTGT TGCAGTTGTG CGAAGCAGAG CTGCTGCAGC GCACGCGGGT GCGCAGTCTG 
GGTGAGCGCA TCACCCACCT GCTGGGCCCG CTGCTCAATG GCGGCCGTGA ACCGGACCTG 
GAAGAAGTGG CGCTGCACTT GCAGCTACCA AGCTGGACCT TGCGCCGCAA GCTCGCGGAG 
GAAGGCACGC GCTTTCGCGA CCTGCTCAAC GAAACCCGGC GCGACCTGGC CGAGACCTAC 
ATCCGTGACA CGGCGCTGGC CTTTGGCGAG ATAGCCTATC TGTTGGGGTT TGCTTCGGCC 
GAGGCCTTCC AGCGCGCATT CAAGCGCTGG ACGGGCCTCA CGCCGGGGGA GTTCCGCCGC 
AGCCAGCGGC AGCCGAGCTA G

Protein sequence

MARPRVRLGE LSVGFVQPLS EALRELGHDP EPLLRRYGLD ATRLSEAGAR LSIPRYMHMG 
HAAIEMSGEA ALGLRMGRLS RLAHTGLAGV TAAQAPTLGE AARTLLRFEP LYAANYRGHS 
RFEEDAQGAW LRFYSISPYN DYNRFVVDSL LAGWLAQLAE LAGTPVQAER LEIEFAAPSY 
AARYQPLCST PVQFAADGNQ LRLSRATLQL ANPGHCPSTW QHLLQLCEAE LLQRTRVRSL 
GERITHLLGP LLNGGREPDL EEVALHLQLP SWTLRRKLAE EGTRFRDLLN ETRRDLAETY 
IRDTALAFGE IAYLLGFASA EAFQRAFKRW TGLTPGEFRR SQRQPS