Gene Plim_2066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_2066
Symbol
ID	9138769
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	+
Start bp	2678616
End bp	2679782
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	56%
IMG OID
Product	Mammalian cell entry related domain protein
Protein accession	YP_003630092
Protein GI	296122314
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCTGAGC GTCAGTTGCA GTTTCGCGTT GGAATGATGG TGCTGGTGGC CATGGCCATC 
GGTGTCGGTC TGCTCGTTCG CGCGGGAAAA CTGGATTCCT ATTGGGATGA AGATTTCAGT 
ATCGCCATCC AGTTTGAATC GGCCGGGGGG ATTTATCCCA GTGCACCCGT CCGACTTTAC 
GGACTGACGA TTGGAAATGT TCGCGATGTC CGCCTGGATA ACAAACGTCG AGGCGTGATT 
GTCATTGCCG AAATCGACGC CAAGCACAAA CTTCCGATTG ATTCCACTGC CCAGGTGGCC 
GTGAGCCTTT TGGGCGAGGG GCATCTGGAA ATCATTCCTG GCCTGTCGGA AGAACCACTC 
AAACATGGCG CAGTGATCAG TGGTCAAGCT GCTGGTGATC CCATGGCTTT GGTCGCTCGA 
CTTGAGGCCA AGACCACCGC CACGATGGAT TCCTTTGCCG CCACGAGCAA GGAATGGGGC 
ACACTCGCCC ATAACGTCAA CAATCTTCTC GAAACCAAAC GCGGGAACAT CGATCAGGTC 
ATCGAGCGGG CCGCCGACTC GTTGGATCAA CTTTCACTGG CCATGAAATC CGCCACTGAG 
TTAATCCAGC AGGCCAATCG CATTGTTGGT GATCCCAAAA CTCAAGCAGC ACTCCAGCAG 
ACCGCTCAAT CACTCCCTCG TCTGGTTAAT GATACTCGAG AGACCATTGT CGTAGCCCGC 
ACGACGCTCG AAAGCATGCA GCAGAATCTG AAAAACCTCG AATCGGTCAC CGATCCACTG 
GCCAAAAAAG GGAACGATAT GATTGTCCGG CTCGACACCA GCCTGGCCAA TCTGGATCGT 
CTTCTGGCCG ATGCCAGTCG GTTTGTCCGG ACCCTGAATA CTCAGGATGG CACACTGCAG 
AAACTGGCGG CTGATCCCCA GCTCTACGAC AACCTGAACC GTTCGGCCCA ACTGGTGACA 
GTCCTCCTGC GCGGCATTGA ACCGATCGTT CAGGACATGC GGGAGTTCAG TGATAAAGTC 
GCTCGCCGCC CCGAGATTCT CGGCGTTGGT GGAGCCATTC AACCCAGCAA CGGCCTGCGC 
GATACCGAAC TGATCGAGCA AAGTGGCGGA ACAGCCCCCA AAACCCAGCA GAAATCGGTA 
CGACCGAGTT TCCTGCCGGG AAGATAA

Protein sequence

MSERQLQFRV GMMVLVAMAI GVGLLVRAGK LDSYWDEDFS IAIQFESAGG IYPSAPVRLY 
GLTIGNVRDV RLDNKRRGVI VIAEIDAKHK LPIDSTAQVA VSLLGEGHLE IIPGLSEEPL 
KHGAVISGQA AGDPMALVAR LEAKTTATMD SFAATSKEWG TLAHNVNNLL ETKRGNIDQV 
IERAADSLDQ LSLAMKSATE LIQQANRIVG DPKTQAALQQ TAQSLPRLVN DTRETIVVAR 
TTLESMQQNL KNLESVTDPL AKKGNDMIVR LDTSLANLDR LLADASRFVR TLNTQDGTLQ 
KLAADPQLYD NLNRSAQLVT VLLRGIEPIV QDMREFSDKV ARRPEILGVG GAIQPSNGLR 
DTELIEQSGG TAPKTQQKSV RPSFLPGR