Gene Plim_4236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_4236
Symbol
ID	9140958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	5410101
End bp	5411336
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	55%
IMG OID
Product	protein of unknown function DUF1501
Protein accession	YP_003632242
Protein GI	296124464
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00624743
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAATCT CTTTTTCCAG TCGACGCGAA TTTCTGAAGC AGGCAGGACT GTTGACTGCC 
TGGAGTCTGA CACTTCCGCA GTTTGTGGTG CAGTCACGCC AGGCGCTGGC TCATGCACCC 
ATTGAGGGTT TGCCGGATGA TCGCATCCTC GTGCTGGTTC AACTGGCTGG CGGGAACGAT 
GGGCTTAACA CACTCGTCCC CTACGGTGAT GATCTGTATT ACAAGGCACG TCCCAAGCTC 
TCTGTGGCGC AGGAAGACGT GCTCAGGATT GACGATTACT GTGGTTTCCA TTCAGAAATG 
TACGCTCTGC GGGAGTTGTG GGAAGATGGC CTGCTCAGTC TGATTCAGGG TGTGGGATAC 
CCGAATCCTG ACCGCTCGCA CTTTCGATCC ACCGAAATCT GGGAGACGGC TTCGGGATCG 
GAGAAGAATA TCGCCAGTGG CTGGATTGGC CGATACTTTG ACAGCGAATG CTCAAAAGCG 
GCGACACCAA CACTGGGTGT GCAGCTTGGC GAACGAACGG CACAAACCTT TGCCGGCGAT 
CATCCGCGCG TTGTGACTCT CTCGAATCCT CAGCTCTTTC AGTTTTCCGG CGGATCAGCG 
CGAGAAGACG AGTTGGCCAA AGTTCATGTT CCCTCAGTGA GTGCGAATTC TTCTTTGGCA 
TTTCTGCAGC GAACAGGGAA CGACGTCCTG TCTGTTTCGA GACAGCTTTC CGAAAAGGTG 
AGGTTGCAGC CGACAACAAG GGATTACCTG CCCTATCAGT TTTCGCAGAC ACTCAGACTG 
GTGGCGAAAA TGATTGCCGC AGAGGTTCCG ACCAGGGTCT ATTACGTATC ACTGCCCGGG 
TTTGATCATC ATGCCACACA GAAGATGCGT CATGCGATGC TGTTGCAGGA ACTGAGTGAG 
AGCCTCTCAA GCTTTGTGCG CGATTTGAAA AACTTAGGGC ATCTGGATCG CACACTGATT 
GTGACCTTTT CTGAGTTTGG CCGCCGTGTG GCCGAGAACC AGAGCGAAGG AACGGATCAT 
GGGACGGCGA ACCTCATGTT CATGGCGGGA GGAACTTCCC GAGCAGGGTT CCACGGAACG 
CGTTCCGATC TTGCCCGACT GGATGACGTG GGGGACTTAC ACCACACCAC TGATTTCCGC 
AGCGTTTATG CCTCGATTCT CAAGGACTGG CTGGGAGCCA ACCCCGCCAG CATCCTCGAT 
CCGTCCATTC TGCCTATGGC AGGAATCCTT GGCTGA

Protein sequence

MAISFSSRRE FLKQAGLLTA WSLTLPQFVV QSRQALAHAP IEGLPDDRIL VLVQLAGGND 
GLNTLVPYGD DLYYKARPKL SVAQEDVLRI DDYCGFHSEM YALRELWEDG LLSLIQGVGY 
PNPDRSHFRS TEIWETASGS EKNIASGWIG RYFDSECSKA ATPTLGVQLG ERTAQTFAGD 
HPRVVTLSNP QLFQFSGGSA REDELAKVHV PSVSANSSLA FLQRTGNDVL SVSRQLSEKV 
RLQPTTRDYL PYQFSQTLRL VAKMIAAEVP TRVYYVSLPG FDHHATQKMR HAMLLQELSE 
SLSSFVRDLK NLGHLDRTLI VTFSEFGRRV AENQSEGTDH GTANLMFMAG GTSRAGFHGT 
RSDLARLDDV GDLHHTTDFR SVYASILKDW LGANPASILD PSILPMAGIL G