Gene Plim_4084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_4084
Symbol
ID	9140804
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	5239148
End bp	5240290
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	55%
IMG OID
Product	protein of unknown function DUF1559
Protein accession	YP_003632094
Protein GI	296124316
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATCGTT CATACCGTCA CTCCGGCCGC AGGGTAGAAA CCTACTCACT CAAAGTGCGC 
CGGTCGTCAA GTGACTATCT ATACAACATT GATCCCGAGA AAGACCTCTT TATGAAAGTT 
CCTGATACTC CTCGTCACCG AGGCTTCACA CTCATTGAAC TCCTGGTGGT GATCGCGATC 
ATCGCCATTT TGATTGCTCT GCTGCTTCCC GCCGTTCAAC AGGCTCGGGA AGCAGCCCGG 
CGAACGCAGT GCCGTAACAA TCTCAAGCAG ATTGGCCTCG CTCTGCACAA CTATGAATCG 
ACATTCGGCC GCTTTCCCTG CGGCTGGAAC GGACACAACA ACGTCGCACA AAGCACCACG 
ATGCGCTGGA GTTTCCTGGC GTATATCCTC CCTTACGTCG ATCAGGCCAA CACGCTCAAT 
CAGTTGGATC TGAACTGGTC CCTCTATCCG CCCGGAGGTG GCCAGCCGCC ACGTGCCATG 
CACGTCAATA CGATCATGAC AAAGATTCCG ACCTATCTTT GTCCGAGTGA TCGCTCGGAC 
TATGTTTCTA GTCCCACAGG GGTGATTGAC TCTGCTCCTT CCAACTATAT GGCCTGCATG 
GGTTCTGGGA TAAACAATGT GGCCGATATC AGTGATGATG GTCAGAGCGA CGACCGTGCC 
GATGGTCTAT TCAGTTCCAT CTCCTGGCGA AGGATTGCCG ATTGTACGGA TGGCTTATCG 
AACACGGTTC TTTGCTCCGA AAGTCTATTA GGGATTGGTG GTGCCGACCC GGCTTCTACT 
GAGAGTCCTG ATGCACAGAC GCATATGGCA TTGGTCAGCC CTCCCACGAG TGTGACAATT 
GCCAATTGTG ATCAGGCGAG GCCCGCGAGT ATCGCCCGCT TCGTGGCCAG TCGAAATCGA 
GTCTGGGCGG GTCAGGCGTA CGAGAACACC GCTTACAACC ACTACTTCAC ACCGAACAGC 
CGGCGCTACG ACTGCTACTT CTGGGTGGCG CAAGGCTTCA AGGCCGCCCG CAGTCGGCAT 
ACAGGCGGTG TCCATACCCT CATGGGCGAT GGGGGAGTTC GATTCACCAG TGAAAACATC 
GACGCCACGA TCTGGCGGAA CATTGCCACA CGTTCTGGTA GTGAAGTCGT CAGCGAATTC 
TAA

Protein sequence

MYRSYRHSGR RVETYSLKVR RSSSDYLYNI DPEKDLFMKV PDTPRHRGFT LIELLVVIAI 
IAILIALLLP AVQQAREAAR RTQCRNNLKQ IGLALHNYES TFGRFPCGWN GHNNVAQSTT 
MRWSFLAYIL PYVDQANTLN QLDLNWSLYP PGGGQPPRAM HVNTIMTKIP TYLCPSDRSD 
YVSSPTGVID SAPSNYMACM GSGINNVADI SDDGQSDDRA DGLFSSISWR RIADCTDGLS 
NTVLCSESLL GIGGADPAST ESPDAQTHMA LVSPPTSVTI ANCDQARPAS IARFVASRNR 
VWAGQAYENT AYNHYFTPNS RRYDCYFWVA QGFKAARSRH TGGVHTLMGD GGVRFTSENI 
DATIWRNIAT RSGSEVVSEF