Gene Plim_3387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_3387
Symbol
ID	9140103
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	+
Start bp	4381434
End bp	4382645
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	56%
IMG OID
Product	type II secretion system protein E
Protein accession	YP_003631399
Protein GI	296123621
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.729797
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGATTT CTCTCCATCC ATTAACCAAA AACGATTTGA AGATTGATGG CTCGTTGGCT 
CGATGTCAGT TGCCGTGGGA GAACCTGAAT CTGCAGGACG CTGACTTTGC TGTGCGGGCC 
GTCGAACAAT TGCTTCGCCT GGCGATTGAT GAGCGTGCGA GTGATGTGCA CCTGGTTCCC 
TCCCCTGCAG GATTGCAGAT TGCCTTCCGG CAAGATGGTT TGCTGGAGCC GATGGGGAGC 
TTTCCACCTG AGGTTTCGCC ACTGATCATC AATCGCATCA AAGTTCTGGC TCAACTGCTG 
ACTTATCGGA CGGATCTGCC TCAGGAAGGC CGCCTCAGGC TTCCCGAGTT TCCGGGGGAA 
TTGCGGGCGA GTACTTTCCC GACCATTCAT GGCGAAAAGG TAGTGGTGCG CCTCTTTATT 
GGTTCCGGGC AGTATCGAGT GCTGGATGAG CTGGGCTATA CACCTCAGGT GCAACTCGGA 
TTGGAGCAGG CATTATTGCA GACCAGCGGG ATGCTGCTGT TGACCGGGCC AGCCGGGAGT 
GGAAAAACGA CGAGCGCTTA TGCCTGTTTG AGGTGGCTGC AAGCCTATCG GAAAGGGCAA 
TGCAGTCTGG TCTCGCTGGA GGATCCCGTC GAAGCGTTTC TTCCGGGAGT TTCGCAGACA 
CAGGTTCGCA GGGGCACGGA ATTCAATTAT GCCCTCGGAT TAAGGTCACT TTTACGGCAA 
GATCCCGATG TGATTTTTGT GGGGGAAATT CGCGATGCCG AGACGGCACA GACGGCCTTT 
CAGGCCTCAC TGGCGGGTCA TCTGGTGATT TCCACGTTTC ATGCGGGCTC AGCCGGAGAT 
GCGATTTGCC GGCTGACAGA TCTGGGAGTT GAACCTTTTC TCCTCCGCAC CGGCTTGATT 
GCCGTGCTGT GCCAGCGACT CGTCAAACGA CTGGTCAAAG ATCGAGAGAC TCCCTTATCA 
ACCCGGCGAT ATGAGGGGCG TTTTGTCGCT GCGGAACTGA TGGAGCCGGA ATTGCATCAC 
CTGGCTCGAC CCATTATGCG CAAAGTGAAT GGCAAGCGTC TTGAGGAACT GGCAGCCCGG 
CATGGTTTCG TTCCCTTACG GGAGGCGCTC GAAGAGGCTG TCCGTACCGG GAAGACCGAC 
TTGCCCGAAG TTTATCGAAT TCTCGGGACT CGACCAGTGG AAGAACGCCG GGATGTTGCT 
GAGGAATTAT AG

Protein sequence

MSISLHPLTK NDLKIDGSLA RCQLPWENLN LQDADFAVRA VEQLLRLAID ERASDVHLVP 
SPAGLQIAFR QDGLLEPMGS FPPEVSPLII NRIKVLAQLL TYRTDLPQEG RLRLPEFPGE 
LRASTFPTIH GEKVVVRLFI GSGQYRVLDE LGYTPQVQLG LEQALLQTSG MLLLTGPAGS 
GKTTSAYACL RWLQAYRKGQ CSLVSLEDPV EAFLPGVSQT QVRRGTEFNY ALGLRSLLRQ 
DPDVIFVGEI RDAETAQTAF QASLAGHLVI STFHAGSAGD AICRLTDLGV EPFLLRTGLI 
AVLCQRLVKR LVKDRETPLS TRRYEGRFVA AELMEPELHH LARPIMRKVN GKRLEELAAR 
HGFVPLREAL EEAVRTGKTD LPEVYRILGT RPVEERRDVA EEL