Gene Plim_1791 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_1791
Symbol
ID	9138492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	+
Start bp	2322880
End bp	2324157
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	55%
IMG OID
Product	NHL repeat containing protein
Protein accession	YP_003629820
Protein GI	296122042
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.326453
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCATGA TCTCCGATAG GCAGTCAATG ACGATCGAAA ACGTGCAGAA TTCAAATCGG 
GCCCAGAGAT CTCATCGCGC TCACCGGCGG TCTCTGCTTT CCGTTCAAAG ACACCGCACT 
GTCACCATGC GTTCCGTCAT AATGCGCCCC GGCCAAACGA GCTTTGGGCC ATCAAACCTA 
ATGCGGCTGG CTGCACTCTG TGTGCTCCTG AGTCTCTTTG CCTTCGCCGA ACTCAATGTC 
GCCCATGCTG GCGAAGTCAA AACAATCTTT GGATCAGGCA AAGATGGATT CAATGGCGAT 
CAGCAGCCAT TCCTCGAAAC TCACAGCGGC CAGCCGTTTG GACTCGTGAT TGGGCCGGAT 
GGTGCTTTGT ATTTCTGTGA GTACACAGGT CACATCATTC GCCGCCTCGA TCTGGAAAAG 
CAGACTGCGA CAACCATTGC CGGGACTCCT GGCAAAAAAG GATTTGCCGG TGACGGCGGC 
CCGGCGACAA AAGCCTTGAT GAACGAACCC CATGAACTCC GTTTTACTCC TGCCGGGGAT 
ATCGTCATTG CCGATATGCG CACGCATACC ATCCGCAAGA TTGATGGCAA AACGGGCATG 
ATTTCCACAC TGGCAGGCAC AGGAACCGCC GGATTCAGTG GTGATGGCGG GCCAGCCGAA 
AAAGCTCAAT TGAATATGCC ACATTCCATT CAGATCGATC CGGCTGGCGA TCTGTTGATC 
TGCGATACCG GGAACCACCG GGTTCGCAAA GTCGATATGA AAACGGGCCT GATCTCGACC 
GCTTACGGAA CTGGCGAAAG GAAACCTGCC AAAGATGGTG ATCCGCAGGT GGGCACACCC 
CTCAATGGCC CGCGCAGTAT CGACTTCACT CCCGAAGGAG ACATGATTCT CGCGCTTCGC 
GAAGGGAACG CGGTCTATCG CTTTCCCAAA GGAGAAGCCA AACTCATCCA CATTGCTGGT 
GTGGGTGGTA AGCCATCTTT AGTCGGTGAC GGGATTGATG CCCGCAAAGC CATTCTCGGT 
GCCCCCAAGG GAGCGGCTGT CGATGCTAAT GGCGACATTT ATCTCGCCGA TACCGAAACA 
CACACGATTC GTGTGATTCG AGCGAAGACC GGCCTGATTG AAACTGTGAT CGGTGATGGC 
AAAGCCGGTG ATGGCCCGGA CGGGGAGGCA AAGACCTGCC GCCTCAACCG GCCCCATGGC 
GTATTCATTA CCAAGGAGGG CTTACTCCTG GTCGGAGACA GTTCCAACAA TAAAGTCCGC 
GTTCTTCCGT TACGATAA

Protein sequence

MAMISDRQSM TIENVQNSNR AQRSHRAHRR SLLSVQRHRT VTMRSVIMRP GQTSFGPSNL 
MRLAALCVLL SLFAFAELNV AHAGEVKTIF GSGKDGFNGD QQPFLETHSG QPFGLVIGPD 
GALYFCEYTG HIIRRLDLEK QTATTIAGTP GKKGFAGDGG PATKALMNEP HELRFTPAGD 
IVIADMRTHT IRKIDGKTGM ISTLAGTGTA GFSGDGGPAE KAQLNMPHSI QIDPAGDLLI 
CDTGNHRVRK VDMKTGLIST AYGTGERKPA KDGDPQVGTP LNGPRSIDFT PEGDMILALR 
EGNAVYRFPK GEAKLIHIAG VGGKPSLVGD GIDARKAILG APKGAAVDAN GDIYLADTET 
HTIRVIRAKT GLIETVIGDG KAGDGPDGEA KTCRLNRPHG VFITKEGLLL VGDSSNNKVR 
VLPLR