Gene Plim_3373 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_3373
Symbol
ID	9140089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	+
Start bp	4367008
End bp	4368348
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	56%
IMG OID
Product	PhoH family protein
Protein accession	YP_003631385
Protein GI	296123607
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.349535
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGACTGG AGCACAGTTC GACGCAAGGC AAGCTCTTCG TTCTCGACAC CAACGTCATC 
CTTCACGATG CGGGGTGTTT ATTTAACTTC GAAGAGAATG ACATCGCCAT ACCGATCACT 
GTGCTGGAGG AACTCGATCG ATTCAAAAAA GGTAACGACG ACATCAACTT TCAGGCCCGT 
GCGTTCCTCC GACGATTGGA CGAACTCGCG GGCGATGTTC TTTCTGCAGA TGGCGCAGCC 
TTAGGCGATG GCTTAGGCCG CATTCGTGTG GTGCTGCGTG GCCACTTTAC CGCCCGCATG 
CGGGAAACTT TTCTCTCCGA CGGCCCCGAT CATCGCATTC TCGATGCCGC ACTGACTCTG 
CAGGAAACGT CAGCTCCCCA GCCCGTTATC CTGGTTTCAA AAGACACCAA CCTGCGGATG 
AAGGCCAAAT CCCTCGGGCT GCCCGCCGAA GATTATTCGA CCGATAAGGT CGAAAGCTTC 
GACAAGCTCT ACACCGGAAA GCGGCTCGTC ACGAACATGC CTTGCGAAAG TGTTTCCGCC 
TTCTATGCCG AAGGTGGCCG CGTGTCAGCA GAAAGCCTGC CGGAAGTAAC CACACCTCGC 
GCTAACGAGA ACTTCATTCT GCGGAATGGT TCGCGCTCGG TCTTGGCCAT GTACAACGCA 
GAAGAAAATG CATTCCACCG TGTGGAACGA ACCACCGCAC TGGGCGTGGT GCCTCGCAAT 
GCCGAGCAGC ACTTCGCCTT GCGGGCACTT CTGGATGATG ACATCAAGCT GGTGACGATT 
GCCGGCAAAG CCGGTTCGGG GAAAACGTTA CTCGCCCTCG CAGCGGCTCT CGAATGCCGG 
AGCAACTACC GCCAGATTCT GCTCGCCCGG CCTGTCGTGC CACTTTCGAA TAAAGACCTG 
GGCTATTTGC CGGGGGATGT GCATGCCAAG CTCGACCCTT ACATGCAGCC ACTCTTTGAT 
AACCTTTCGG TCATCAAGCA TCAGAACCAT GAAGGCGATA CGGCGAAACT CGTCCAGCAG 
ATGCAGGAAG ATCATCGGCT CGAAATTACG CCACTAGCGT ATATCCGCGG CCGCAGTTTG 
CAGCGGGTCT TCTTCATTGT CGATGAAGCG CAGAACCTGA CACCGCACGA AGTGAAGACC 
ATTATCACGC GGGCAGGCGA AGGAACAAAG ATCGTCCTGA CGGGCGATAT CCACCAGATC 
GACCATCCCT ACCTCGATTC GCTCTCGAAC GGGCTGTCGT ACCTCATCAA CCGCATGGTC 
GGCCAGAAGC TCTACGCCCA CGTGACGCTC GAAAAAGGCG AACGCTCCCA ACTCGCCGAA 
CTCGCCACCG ATTTGCTTTA G

Protein sequence

MRLEHSSTQG KLFVLDTNVI LHDAGCLFNF EENDIAIPIT VLEELDRFKK GNDDINFQAR 
AFLRRLDELA GDVLSADGAA LGDGLGRIRV VLRGHFTARM RETFLSDGPD HRILDAALTL 
QETSAPQPVI LVSKDTNLRM KAKSLGLPAE DYSTDKVESF DKLYTGKRLV TNMPCESVSA 
FYAEGGRVSA ESLPEVTTPR ANENFILRNG SRSVLAMYNA EENAFHRVER TTALGVVPRN 
AEQHFALRAL LDDDIKLVTI AGKAGSGKTL LALAAALECR SNYRQILLAR PVVPLSNKDL 
GYLPGDVHAK LDPYMQPLFD NLSVIKHQNH EGDTAKLVQQ MQEDHRLEIT PLAYIRGRSL 
QRVFFIVDEA QNLTPHEVKT IITRAGEGTK IVLTGDIHQI DHPYLDSLSN GLSYLINRMV 
GQKLYAHVTL EKGERSQLAE LATDLL