Gene Plim_2067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_2067
Symbol
ID	9138770
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	2679833
End bp	2680948
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	52%
IMG OID
Product	NHL repeat containing protein
Protein accession	YP_003630093
Protein GI	296122315
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCTTGC CTATTTCTCG ACGCGATGCA TTGAAGACCG CCTGTGTGGC CACTGCCGGT 
TTGATTTCAG GGGCTCCGTT CGTGCATGCT CAAAGTAAAG CGGATTCTCA GCCGCTGACC 
ACTGGGCAAG GCGATTATCA GTACGCAGTG ATTCACAACT GGGCTCAACT TCCCAGCGAG 
TTTACGTGGC AGACAACTCA GGCCGTGGTG GTGGATAAGA ATGGCTTTGT CTATCTGAAT 
CACACGGGTG ACTTCAACAA GAAGAATCAC CCGAATGTCT TCGTCTTCGA TCAGGACGGA 
AAGTACGTCC GCTCCTTCGG CCAATACTTT CAGGGCGGCG CTCACGGGCT GGAACTTCGT 
GAAGAGAATG GTGAGGAGTT TCTTTACTTC TCGAATCCCG ACCCGGTGCA GTCGATTGCT 
AAGACCAACC TCAAGGGGGA ACTGATCTGG GAACGGTTTG CACCCATGGA ATCGGGCATT 
TATCCCGAGG GTGAGAACAC CTTGCCACAG CGTGTTCGTT CTGGTGAAGT TCCTCGCAAA 
GGAGTGGGTG GACCCAATCG CTATAAGCCG ACGAACATTG CCTTTTTGAA GGATGGCGAT 
CTGCTGGTGG CCGATGGATA TGGTTCCAAT TACATCCATC GCTATACAAA AGACGGCGAG 
TACAAATTGA GCTTTGCTGG TGCCGGCCCC AGTCCGGGAA AGTTCAGCAC CAACCATGGT 
CTGGCCTTGG AAGCACGACC CGGGAAAGAA GAAATTCTCT ATGTGACTGA CCGCAGTCGC 
AACACGATTC AATGCCTGAC GCCTGAGGGC AAATTTGTTT CACTCATCGA CGGTTTTCAG 
AAGCCCTGCC ACGTCGATTT CTACAAGGAT CTGATGCTGG TGCCAGAGCT TCAGGGTCGT 
GTGACGCTCC TGGATGGCAA CAACAAGGTT CTGGCTTATC TGTGCGATGA CCATCAGAAC 
GTCAATGCCG GTAAGGTGAA TCGAGGTGAC GCCAAGCAGT GGGCACCCGG CAAATTTGTC 
CATCCGCACG ATGCCACTTT TGACCATAAT GGCAACATTA TTGTCAGTGA ATGGGTCACA 
ACGGGACGGA TTACCTTACT CAAGAAATTG AGTTAA

Protein sequence

MALPISRRDA LKTACVATAG LISGAPFVHA QSKADSQPLT TGQGDYQYAV IHNWAQLPSE 
FTWQTTQAVV VDKNGFVYLN HTGDFNKKNH PNVFVFDQDG KYVRSFGQYF QGGAHGLELR 
EENGEEFLYF SNPDPVQSIA KTNLKGELIW ERFAPMESGI YPEGENTLPQ RVRSGEVPRK 
GVGGPNRYKP TNIAFLKDGD LLVADGYGSN YIHRYTKDGE YKLSFAGAGP SPGKFSTNHG 
LALEARPGKE EILYVTDRSR NTIQCLTPEG KFVSLIDGFQ KPCHVDFYKD LMLVPELQGR 
VTLLDGNNKV LAYLCDDHQN VNAGKVNRGD AKQWAPGKFV HPHDATFDHN GNIIVSEWVT 
TGRITLLKKL S