Gene Plim_4087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_4087
Symbol
ID	9140807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	5242682
End bp	5244043
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	55%
IMG OID
Product	protein of unknown function DUF21
Protein accession	YP_003632097
Protein GI	296124319
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAATGGG GACTTTTCGG CGAGCTGGCT CTCATCCTCT TGCTGATTCT GTTCAACGGA 
TTCTTCGCCG GTGCGGAGAT CGCGATTCTG ACTGCCAAAC GCGGGCGGCT GGAACAGCTT 
TCACAGGAAG GCGATCGTGG TGCCAAAGCG GCTCTCAAGC TCTCCAGTGA CGCCGATCGG 
TTTTTACCCA CTGTTCAAGT TGGGATCACA CTCGTCGGTA CGTTTGCCGC CGCCTTTGGT 
GGTGCCAGCT TCATCAGCGA GGTCTCGCAT CTCATTGGAC AAATCCCTGT TTCCTGGATT 
CAGCAGCGTA GTGAAACGAT TTCTCTGGGT GTCATTTCGG TCGGGATTGC CTTCTTTTCG 
CTGATTCTGG GCGAACTCGT TCCCAAGCGA GTCGCGTTGC AGAATGCTGA GTTCATGGCC 
CGCTGGGTGG CCTTGCCCAT GGTACTTCTC CAGACCATTG CCCAGCCATT TGTCTGGTTC 
CTGCGCGTCT GTACCAAATC CGTGTTGCTC ATTCTGGGCC AGAAAACCGA GATCCGCGAC 
AGTGTCTCGG TCGAAGACAT TCAGCACCTG ATTGATGCCG GTCATGAAGC CGGAATTCTG 
CACGAGGCCG AACAGCAGAT GGCCCAGCAG GCTTTAAAAA TGCGCGAGCG GACAGCCGCC 
GAAATTCTCA GGCCACGAAT CGATATTGAT GCGATCGACG TCGATACACC CCCCGAAGAA 
GTCCTGGGAG CCATGGCCAT GTCGGGCTTC TCCCGGGTAC CTGTTTGCGA AGGGAGCATC 
GATCGGATTG TCGGCTTCAT TTACATCAAA GACGTCTTTC TCGAAAACTA TCTGGGCAGG 
TCTCTCGATA TCCGCCGGGT GATGCGCGCC CCGCTCTTTA TTCCCAAAAC GCTGACCATC 
TCGAAACTGC TCGAACTCTT CCAGAAAGAG CGGACTCAAC TCGCGATCGT GCTCGACGAA 
TATGGTGGTA CCGAAGGGAT GGTCACCCTC GAAGATGTCA TGGAAATCCT CGTCGGCTCA 
ATTCATGACG AGCATCGCCG CGATGACGAG CAACTGATTG TCCGACGTGC TGATGGCAGT 
CTGCTGGCAG ATGCTGCTCT GAACCTGCAT GAACTGCAGG AAGCGTTGGA ATTCAGCAAA 
TGGCCTGAAC CTCCTCCTCG AGGCATTGCC ACCATCTCGG GACTGGTCGT CGCCCTGCTT 
AAGCGACCTC CCAAAATTGG AGATATCATC CAATGGAGCC AACTCCGCGT CGAAGTGGTC 
GATATGGATG GCCCGCGGAT CGACCGGCTG CTTGTGAGTC GCATCGTTCC TGAATCCTCG 
AACGAAGCCG AGGCCAAACC ACAGGAAGAA ACGCAAAGCT AG

Protein sequence

MEWGLFGELA LILLLILFNG FFAGAEIAIL TAKRGRLEQL SQEGDRGAKA ALKLSSDADR 
FLPTVQVGIT LVGTFAAAFG GASFISEVSH LIGQIPVSWI QQRSETISLG VISVGIAFFS 
LILGELVPKR VALQNAEFMA RWVALPMVLL QTIAQPFVWF LRVCTKSVLL ILGQKTEIRD 
SVSVEDIQHL IDAGHEAGIL HEAEQQMAQQ ALKMRERTAA EILRPRIDID AIDVDTPPEE 
VLGAMAMSGF SRVPVCEGSI DRIVGFIYIK DVFLENYLGR SLDIRRVMRA PLFIPKTLTI 
SKLLELFQKE RTQLAIVLDE YGGTEGMVTL EDVMEILVGS IHDEHRRDDE QLIVRRADGS 
LLADAALNLH ELQEALEFSK WPEPPPRGIA TISGLVVALL KRPPKIGDII QWSQLRVEVV 
DMDGPRIDRL LVSRIVPESS NEAEAKPQEE TQS