Gene PP_2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PP_2021
Symbol
ID	1042907
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas putida KT2440
Kingdom	Bacteria
Replicon accession	NC_002947
Strand	+
Start bp	2294322
End bp	2295452
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	64%
IMG OID	637145435
Product	hypothetical protein
Protein accession	NP_744171
Protein GI	26988746
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2706] 3-carboxymuconate cyclase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.145054
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCGGA CCTGGACGAG CCTGCTGACC GCTAGCCTGA TGAGCCTGAC AATCTCTGCC 
CACGCTGCCA CCTTGCTGGT GGGCAGCTAC ACCGATGGCG CCAGCCAGGG TATCTACCGC 
TACCATTTCG ACGACAAGGC CGGCCAAATC GGCCCCACAC CTCTGCAGGT GGTGAAAAGC 
GTCAGCCCTT CGTGGCTGGT GCTGTCGGCC GACCAGCGTC AGCTGTTCGC GGTGAATGAG 
ACCCCGCAGG GCCATGCCAG CAGTTTCAGC ATCAGCAGCA AAGGCGAAAT CAAGCCGCTC 
AACCAAGTGG TCACCCAGGG CGACGAGCCC ACCCACGCCA GCCTCAGCCG TGACCAGCGC 
TACCTGTTCG TGGCCAACTA CGCGGTCAAC CCCGACCCCG GTGGCAGCCT GGTGGTGATC 
CCGGTGGCCA AGGACGGCAC GCTCAAGCCC GTGGTGCAAC AGGCCCGGCA TAAGGCGAGT 
GGGGTCAACC CTGAGCGCCA GGCCGGTGCC CACGTGCATT CGCTGGTGCT GTCGCCGGAT 
GGCCAGCACC TGTATGCCAG CGACCTGGGT GCCGACAAGG TGTTCATCTA CCGCTACGAC 
GGTGCCAGTG CGGACCACCC GCTGACAGCG GCGATACCTG CGTCCGTGGC CTTGCCGCCG 
GGCAGCGGTC CGCGTCACTT GCTGTTCGAC GCCAAGGGCC GGCACGCCTA CCTCACCCTG 
GAAATGAACG CCGAGGTGGT GATGTTCGAT GTGCAGGACG GCAACCTGGT TGAACGCCAG 
CGCTTACCCC TGACCGAGCG CCAGGAGGCC GCAGCGAAGG CAGCAGGTGG CTTGCACCTG 
TCGGCGGACG GGCGCTTCCT GTACGTGAGC AACCGTGGCA CGGCCAATGA AATTGTGGCG 
TTCAGCGTGG GCAAGCAGGA CGGCCAGTTG ACGTTCCTGC AGCGTCGCCC GGCAGAAGGT 
GATCACCCTC GGGAGTTTGC CCTGGACCCG AGTGACAACT TCCTGCTGGT GGCCAACCAG 
AAGAGCAACC AGATCGTGGT GATACGTCGC GATCCGCGCA GTGGCAAGCT GCTGGAGACG 
GTGCAGACGC TGAAGCAGGA TGCACCCTCG GACCTCAAGT TCATCGAGTG A

Protein sequence

MNRTWTSLLT ASLMSLTISA HAATLLVGSY TDGASQGIYR YHFDDKAGQI GPTPLQVVKS 
VSPSWLVLSA DQRQLFAVNE TPQGHASSFS ISSKGEIKPL NQVVTQGDEP THASLSRDQR 
YLFVANYAVN PDPGGSLVVI PVAKDGTLKP VVQQARHKAS GVNPERQAGA HVHSLVLSPD 
GQHLYASDLG ADKVFIYRYD GASADHPLTA AIPASVALPP GSGPRHLLFD AKGRHAYLTL 
EMNAEVVMFD VQDGNLVERQ RLPLTERQEA AAKAAGGLHL SADGRFLYVS NRGTANEIVA 
FSVGKQDGQL TFLQRRPAEG DHPREFALDP SDNFLLVANQ KSNQIVVIRR DPRSGKLLET 
VQTLKQDAPS DLKFIE