Gene PP_5045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PP_5045
Symbol	thiI
ID	1041702
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas putida KT2440
Kingdom	Bacteria
Replicon accession	NC_002947
Strand	-
Start bp	5750099
End bp	5751553
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	60%
IMG OID	637148444
Product	thiamine biosynthesis protein ThiI
Protein accession	NP_747146
Protein GI	26991721
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0301] Thiamine biosynthesis ATP pyrophosphatase
TIGRFAM ID	[TIGR00342] thiazole biosynthesis/tRNA modification protein ThiI

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.675648
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTTA TCGTCAAAGT CTTCCCAGAA ATCACCATCA AAAGCCGGCC GGTGCGCAAG 
CGCTTCATCC GCCAGCTTGG CAAGAACATC CGCAACGTGC TCAAGGATCT CGACCCTGAG 
CTCGCGGTCG ATGGTGTCTG GGACAATCTC GAGGTGGTCA CCCGCGTCGA AGACGAAAAA 
GTCCAGCGCG AGATGATCGA ACGCCTCACC TGCACCCCGG GTATCACCCA CTTCCTGCAG 
GTAGAGGAAT ACCCGCTGGG TGACTTCGAC GACATCGTCG CCAAGTGCAA GCACCACTTC 
GGCCACCTGC TGGCCGGCAA GCACTTCGCC GTGCGCTGCA AGCGCGGTGG CCACCATGAC 
TTCACCTCGA TGGACGTCGA CCGTTACGTC GGCAGCCAAC TGCGTCAGCA GTGTGGCGCC 
GCCGGGATCG AGCTGAAAAA GCCTGAAGTG CTGGTGCGCA TCGAAATCCG CGACCAGCGC 
CTGTACGTGA TCCACAACCA GCACAATGGC ATCGGCGGTT ATCCGCTGGG TGCCCTGGAG 
CAGACTCTGG TGCTGATGTC CGGTGGTTTC GACTCCACCG TTGCGGCCTA CCAGATGATG 
CGCCGCGGCC TGATGACCCA CTTCTGCTTC TTCAACCTCG GCGGCCGTGC CCACGAGCTG 
GGCGTAATGG AAGTGGCCCA TTACCTGTGG AAAAAATACG GCAGCAGCCA GCGCGTACTG 
TTCATCAGCG TGCCGTTCGA AGAAGTGGTT GGCGAGATCC TCAACAAGGT CGACAACAGC 
TACATGGGCG TGACCCTCAA GCGCATGATG CTGCGCGGCG CCGCCCATAT GGCCGACCGC 
CTGCAGATTG ACGCGCTGGT GACCGGCGAA GCGATTTCCC AGGTGTCCAG CCAGACCCTG 
CCGAACCTGT CGATCATCGA CTCGGCCACC GACAAGCTGG TGCTGCGCCC GCTGCTGGCC 
AGCCACAAGC AGGACATCAT CGACCAGGCC ACCGAAATCG GTACCGCGGA CTTTGCCAAG 
CACATGCCGG AATACTGCGG CGTGATCTCG GTAAACCCGA CCACCCATGC CAAGCGTCAC 
CGCATGGAGC ACGAAGAAAA GCAGTTCGAC ATGGCCGTGC TGGAGCGCGC TCTTGAGCGC 
GCCAAGTTCA TTTCCATCGA TCATGTGATC GATGAGCTGG GCAAGGACAT CGAAATCGAG 
GAAGTGGCCG AGGCGCTGCC AGGCCAGATC GTCATCGACA TTCGCCACCC CGATGCCCAG 
GAAGACGAAC CTCTGGTGCT GGAAGGTATC GAAGTCCAGG CCATGCCGTT CTACGCCATC 
AACAGCAAGT TCAAGCACCT GGACCCCACG CGCCAGTACT TGCTGTATTG CGACAAGGGT 
GTGATGAGCC GTTTGCACGC ACACCATCTG CTCAGTGAGG GACATGCCAA TGTGCGTGTT 
TATCGTCCGA CATAA

Protein sequence

MKLIVKVFPE ITIKSRPVRK RFIRQLGKNI RNVLKDLDPE LAVDGVWDNL EVVTRVEDEK 
VQREMIERLT CTPGITHFLQ VEEYPLGDFD DIVAKCKHHF GHLLAGKHFA VRCKRGGHHD 
FTSMDVDRYV GSQLRQQCGA AGIELKKPEV LVRIEIRDQR LYVIHNQHNG IGGYPLGALE 
QTLVLMSGGF DSTVAAYQMM RRGLMTHFCF FNLGGRAHEL GVMEVAHYLW KKYGSSQRVL 
FISVPFEEVV GEILNKVDNS YMGVTLKRMM LRGAAHMADR LQIDALVTGE AISQVSSQTL 
PNLSIIDSAT DKLVLRPLLA SHKQDIIDQA TEIGTADFAK HMPEYCGVIS VNPTTHAKRH 
RMEHEEKQFD MAVLERALER AKFISIDHVI DELGKDIEIE EVAEALPGQI VIDIRHPDAQ 
EDEPLVLEGI EVQAMPFYAI NSKFKHLDPT RQYLLYCDKG VMSRLHAHHL LSEGHANVRV 
YRPT