Gene RPB_2640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2640
Symbol
ID	3910432
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	3019636
End bp	3020607
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	70%
IMG OID	637884539
Product	thiamine-monophosphate kinase
Protein accession	YP_486253
Protein GI	86749757
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.23047
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.216691
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCTCCG GTGAAGACGA TCTGATTGCC CGCTACTTCA AGCCGCTTGC GACCGATCCG 
GGCGCGCTGG GGCTGGTCGA CGACGCGGCG GTGCTGGCGG CGTCGCGCGA CGATCTGGTG 
CTGACCACCG ACGCCATCGT CGAGGGCGTG CATTACCTGC CCGGCGATCC GCCCCGGGCC 
ATCGCCCGCA AGGCGCTGCG GGTGAACCTG TCCGACCTCG CCGCCAAGGG GGCGACGCCC 
GCGGGGTTCC TGCTGACGCT GGCGCTGCGC AGCGCCGACG AGCGCTTCCT GGCGCCGTTC 
GCACAGGCGC TCGGCGAGGA TGCCGCCCTT TTCGATTGTC CGCTGCTCGG CGGCGATACG 
GTGTCCACCC CGGGGCCGAT GATGATTTCG ATCACCGCCA TCGGCCGGGT GCCGCCGGGT 
CGCATGGTGC GGCGCAACAC GCTTTGTGCC GGGGACCGGA TCCTCGTCAC CGGCACGATC 
GGCGACTCGG CACTCGGCCT CGACCTGCTG CAGGGCGCGA ATGCCGACAT CTCCGACGAG 
CATCGCGCCT TTCTGATCGA CCGCTATCGC GTGCCGCAGC CGCGTTTGGC CTTGGCGCAA 
GCCATACGTG ACCATGCCGG CGCGGCGATG GACGTGTCCG ACGGGCTGGC AGGCGATCTC 
GCCAAGATGT GCGCCGCCTC CGGCGTCACC GCGATCCTCG ACGCTGCGGC CGTCCCGCTC 
TCCGCTGCGG CGCAGGCGAT GATCTCGGGC GAGCCGGCGA AGCTGGCCCG CGTGCTCGGG 
GGCGGTGACG ACTATGAGCT GCTTTGCGGC GTTGCAGCAC AGCAGCTCGA CCCGTTTCTT 
GCTGCAGCGC AGCGAATAGG GGTTTCGGTC AGCGTCATCG GCTCCGCCGA AGCCGGAACC 
GGAGCGCCGC GATGGCGCGA CGCCGAGCAT CGTGACATCG CGCTGTCAGG GCTGTCATAC 
AGTCATTTCT AG

Protein sequence

MPSGEDDLIA RYFKPLATDP GALGLVDDAA VLAASRDDLV LTTDAIVEGV HYLPGDPPRA 
IARKALRVNL SDLAAKGATP AGFLLTLALR SADERFLAPF AQALGEDAAL FDCPLLGGDT 
VSTPGPMMIS ITAIGRVPPG RMVRRNTLCA GDRILVTGTI GDSALGLDLL QGANADISDE 
HRAFLIDRYR VPQPRLALAQ AIRDHAGAAM DVSDGLAGDL AKMCAASGVT AILDAAAVPL 
SAAAQAMISG EPAKLARVLG GGDDYELLCG VAAQQLDPFL AAAQRIGVSV SVIGSAEAGT 
GAPRWRDAEH RDIALSGLSY SHF