Gene RPB_1341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1341
Symbol
ID	3907849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1527685
End bp	1528665
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	65%
IMG OID	637883235
Product	homoserine kinase
Protein accession	YP_484962
Protein GI	86748466
COG category	[R] General function prediction only
COG ID	[COG2334] Putative homoserine kinase type II (protein kinase fold)
TIGRFAM ID	[TIGR00938] homoserine kinase, Neisseria type

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.528429
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.431849
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGTCT ACACCGACGT CGCCGCCGAC GACCTCGCGG ATTTCCTCAA ATCCTATGAG 
ATCGGCGATC TGTTGTCCTA CAAGGGCATC GCCGAGGGCG TCGAGAATAC CAATTTCCTG 
CTGCACACCA CGCGCGGCAG CTTCATTCTC ACGCTGTACG AGAAGCGCGT CGCCTCCGAG 
GATCTGCCGT ATTTCCTGGC GCTGATGGCG CATCTGGCCG CGCGCGGCGT CAGTTGCCCG 
CAGCCCGAAA AGACCCGCGA CGGCGAGATC TGCGGCGCGT TGTCCGGCCG CCCGGCGGTG 
ATCATCAATT TCCTCGAAGG CGTCTGGCCG CGCCGTCCCA ACGCGGTGCA TTGCGCCGGC 
GTCGGCGAGG CGCTGGCCAA GATGCACCTC GCCGGCCTGG ATTTTCCGCA GCATCGCGCC 
AATCCGCTGT CGGTGTCGGG CTGGCGGCCG CTGTTCGACC TCGCCGCCGC GCGCGCCGAC 
GAGATCCAGC CAGGCTTGCG CGATTTCATC GCCGCCGAGC TCGATCACCT CGAAGGCCGC 
TGGCCGCGGC ATCTGCCGAC TGGCGTGATC CATGCCGATC TGTTTCCGGA CAACGTTTTC 
TTCATCGGCG ACACGCTGTC GGGACTGATC GACTTCCCGT TCTCCTGCAA CGACATCCTC 
GCCTACGACG TGGCGATCTG CCTGAATGCC TGGTGCTTCG AGCCGGACCA CGCCTTCAAC 
GTCACCAAGG CGCGGGCGCT GCTGAATGCG TATCAACGCG GCCGCGCCTT GAGCGAGGCC 
GAGCAGACGG CGCTGCCGCT GCTGGCGCGC GGCGCGGCGA TGCGCTTCCT GCTGACCCGG 
CTGGTCGATG TTCTCGACGT GCCGGAAGGC GCGCTGGTCA AGCCGAAGGA TCCGCTGGAA 
TATTTCCGCA AGCTGCGCTT CCAGCAAAAT GTCGCCAGCA TTCGCGATTA TGGTGTCGAA 
GCTGCGGGAG CGGTGGCGTG A

Protein sequence

MAVYTDVAAD DLADFLKSYE IGDLLSYKGI AEGVENTNFL LHTTRGSFIL TLYEKRVASE 
DLPYFLALMA HLAARGVSCP QPEKTRDGEI CGALSGRPAV IINFLEGVWP RRPNAVHCAG 
VGEALAKMHL AGLDFPQHRA NPLSVSGWRP LFDLAAARAD EIQPGLRDFI AAELDHLEGR 
WPRHLPTGVI HADLFPDNVF FIGDTLSGLI DFPFSCNDIL AYDVAICLNA WCFEPDHAFN 
VTKARALLNA YQRGRALSEA EQTALPLLAR GAAMRFLLTR LVDVLDVPEG ALVKPKDPLE 
YFRKLRFQQN VASIRDYGVE AAGAVA