Gene Plim_2161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_2161
Symbol
ID	9138865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	+
Start bp	2784823
End bp	2786523
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	53%
IMG OID
Product	Stage II sporulation E family protein
Protein accession	YP_003630186
Protein GI	296122408
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0242635
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAAAT TGCTCCTGCT TCAAGGAGGG GAAGCCACCC CTTATGAAAT CGCTGGTGGC 
GAAGTGGTGC TGGGGCGACA TCCTGAATGC TCGATCCAGA TCAACTCGAA CATGGTTTCC 
CGCAAGCATG CTCGAGTCTT TTCTCACGAT GATGGCTTCG TCATTGAGGA TCTCGGGAGT 
GGTAACGGCA CGTTCCTGAA TGGCAAAAAA CTCGAAGCAG CGACAAAAAT CAAAGATGGC 
GACCGCATTA AGCTGGGTCC CATTCTCCTG CGATTTGAAG ATCCGGATAA TCCTGCCAGT 
CGCCCCGCGC TGGCTCCAGG AAGTGGAGTC AGTGGAGCCG GAAACCAGGC AGCTACAGCG 
ACTTTCAATC TCGAGTTTGC CTCTGGCGAT GACGATGTCG CCACTGTGAT GGGAACATCC 
GGGCGTGTCG AAGGGTTTGG CGCCCTGGAA GTTCAACCCG AAGCCAAACT GAAGGCCGTG 
CTCGAAATCA GCCGTGCCTT AGCAGGCAGC ACTGATCTTG ATGGATTGCT CCCCAAGATA 
CTCGACACGC TGTTCAATAT CTTTCCACAT GCGGATCGTG GCGTTGTTCT CTTCAAAGAA 
GACGATGGCA AACTCATTCC GCGAGCGATT AAACATCGTC GCTCAGACGA AGATGAATCG 
GTGAAATTGA GCCGGACAGT TCTTAACACT GTGCTCGAGC AGAAAACAGG GATTCTTTCG 
GCAGACGCAA CGAACGATTC TCGTTTTGAA GCCAGCGAAT CAATCTCGGC TCTCACCATC 
CGCTCGATGA TGGCTGTCCC CATGCTGAGC GTCGCCGGTG ATGTTCTGGG TGTGATTCAT 
ATCGATACTC AGAATGCCTT CAACCAGTTT AAAAAAGATG ACCTCGATCT GTTGATCGCG 
GTTGCTGGTC AGGCGGGTCT TTCTTATGAA ACCGCTCGAC TCATGGTGAC GGCTCTGGAA 
AAACAGAAGC AGGACCGTGA AATGCAGATT GCCGCCAATG TGCAACTGGC CCTGCTGCCG 
GAAAGTCTTC CCAAAGTCGA TGGTTACCAG TTCTACGCCT CTTACGATTC GGCACAGGCA 
GTAGGTGGCG ATTACTACGA CTGCATGCAA CTCGAAGGTG ATCGCGTCTT CTTTGCTTTT 
GGCGATGTGG CAGGGAAGGG TGTGCCTGCT TCACTGGTCA TGTCCCGAAT TTCCAGCGTC 
GTGCAGAACG TGATGGCCTT CGTGACAGAC GTTGGCGTCG CTGTCGGACG AATTAATAAT 
CAGATGTGTG CAAAAGCTGT CGAAGGCCGG TTTGTGACCT TCGTCCTGGG CGTCATTCAT 
ACGCAAACGG GCGAAATGTC TCTCGTAAAT GCCGGCCACA TGCCCATCAT GATCCGCAAG 
GCCGATGGGA CAGTCGAAGA ATTCGGAGCC GAAGCCGTCG GTATTCCTTT AGGGGTCATG 
GAAGATTACC CCTTCGATGT GGTCACGAGA CAAATTGCAC CAGGCGAGAC ATGCCTGATC 
TACACCGATG GTGTCAGTGA GGCCATGAAT CACAACAGTG ATCTTTACGG CATTGAACGG 
ATTCGCGAAC TGATGCATGC CCACGGGCAT GAAGGGGCCG AAGAGTTAGG ACGGACGATC 
CTGCAGGATG TCCGCCGCCA TGCCAATGGT CGTCCTCAGA ACGACGACAT CACGCTGATG 
CTCTTCAGCC GTCTTGGCTG A

Protein sequence

MAKLLLLQGG EATPYEIAGG EVVLGRHPEC SIQINSNMVS RKHARVFSHD DGFVIEDLGS 
GNGTFLNGKK LEAATKIKDG DRIKLGPILL RFEDPDNPAS RPALAPGSGV SGAGNQAATA 
TFNLEFASGD DDVATVMGTS GRVEGFGALE VQPEAKLKAV LEISRALAGS TDLDGLLPKI 
LDTLFNIFPH ADRGVVLFKE DDGKLIPRAI KHRRSDEDES VKLSRTVLNT VLEQKTGILS 
ADATNDSRFE ASESISALTI RSMMAVPMLS VAGDVLGVIH IDTQNAFNQF KKDDLDLLIA 
VAGQAGLSYE TARLMVTALE KQKQDREMQI AANVQLALLP ESLPKVDGYQ FYASYDSAQA 
VGGDYYDCMQ LEGDRVFFAF GDVAGKGVPA SLVMSRISSV VQNVMAFVTD VGVAVGRINN 
QMCAKAVEGR FVTFVLGVIH TQTGEMSLVN AGHMPIMIRK ADGTVEEFGA EAVGIPLGVM 
EDYPFDVVTR QIAPGETCLI YTDGVSEAMN HNSDLYGIER IRELMHAHGH EGAEELGRTI 
LQDVRRHANG RPQNDDITLM LFSRLG