Gene Plim_1047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_1047
Symbol
ID	9137733
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	1322968
End bp	1324461
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	60%
IMG OID
Product	transposase IS4 family protein
Protein accession	YP_003629086
Protein GI	296121308
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.183518
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTTTTA CTTCCAGAGC CCTCGGCAGA GATAGATCAT TTGAACTCGT GAAGCAGTCT 
TTCTGGCAGG ACGAAGGTCT GCCGTTCTCG GATGCGCTGA CAACGCGGCA GTTGGAAGAG 
GTTTTTGAGG CCGAAGAGGT CTCGTTTGGA AGAGACCCGT GCGTAAGCGA ACAGGCATCG 
ATCGAGGATG GCGGGCTGGT CTACACACGC GGCGTGACGT TATGGGCCAT GCTCTCTCAA 
GCCCTCTTCA CCGACGTTCA ACGAGCCTGT CGCGCGGCGG TTCAGCGCGT GGCGGTGTAC 
TACGCTCTAT CGGGCATCAG AATCTCCTCG ACGAACACCG GTGCCTACTG TCGCGCGCGG 
GCCAAGATTC CGGAAGGTGT CGTCCAGCGA CTGGCAGTCG GCGTCGGCCA GAGGTGTGAG 
GCAGCGGTTC CCGACAAGTG GCGCTGGCAT GGATTCCGCA CGCTGGTCAT TGATGGCACC 
ACATGCTCGA TGCCGGACAC CCAGGAGAAT CAGGCGGAGT ACCCTCAACC CTCTTCGCAG 
GGGAAAGGCT TGGGATTTCC CATCCTGCGG GCCGTGGCCC TGACATCGCT CGCGACAGGG 
ATGATTCTGG CTCTGGTGAC CGGTCCCTGT GCAGGAAAGG CGACCGGTGA GACGGCTCTG 
TTTCGAACGT TGTTCGATCA GTTGAAAGCG GGTGATCTGG TGCTGTCAGA TCGGTACTAC 
GGCGGCTGGT TCATGCTGGC ACTGCTGCAA GAACTGGGGG TCGAGTTTGT AACTCGGCTG 
CACCAGTTTC GGATTGCAGA CTTCCACCAG GGGAAACGGC TGGGCCAGAG AGATCACGTC 
GTGGCCTGGG CCAAACCGCA AAAGCCCGCG TGGCTCGATC AGGCAACCTA TGATCGTCTG 
CCCGATCAGT TGGAAGTCCG TGAGATCGAG GTGCAGGTCC CCGTCCCCGG CTTCCGCACC 
GCCTCCCTGG TGGTGGTCAC GTCGCTGCGA GATCACAGAC GTTTTCCACG GGAGGAACTG 
GCCCTGCTCT ACCGCCGCCG GTGGACTGTG GAACTCGAAC TGCGAGACAT CAAGGCCACG 
ATGGATCTGG CCGTCCTGCG CTGCACGAAA CCGGCATGGG TGCGACAAGA ACTCTGGACG 
GGCCTGTTGG CGTATAACCT GATCCGTCAG TCCATGCTGC AGTCGGCACT GGGCGGCGAA 
GTCCGACCCG AACAGTTGAG CTTTGCCGCA TCCTTAACAA ATGCTGGCCA ATATGTGGTT 
GCTGGCCGCG ATGCCGCGCG ACCATACGAG AACCGATGTA GAACTCCTCA TTGTGCTGCG 
AATGATCAAC GGTTATTCGC ATCGTGTCGG CCACCGCCCG GATCGAATGG AGCCCCGCGC 
GGTCAAACGC CGCCCCAGTC CCATCGCCCT GCTCGCCGCA CCCCGCGAGG CCGCTCGCAA 
TCAAGTCCTT GCGGGTATCA ATGGAAAGTG GTCAACGCGA TGACGCGTTG TTAA

Protein sequence

MSFTSRALGR DRSFELVKQS FWQDEGLPFS DALTTRQLEE VFEAEEVSFG RDPCVSEQAS 
IEDGGLVYTR GVTLWAMLSQ ALFTDVQRAC RAAVQRVAVY YALSGIRISS TNTGAYCRAR 
AKIPEGVVQR LAVGVGQRCE AAVPDKWRWH GFRTLVIDGT TCSMPDTQEN QAEYPQPSSQ 
GKGLGFPILR AVALTSLATG MILALVTGPC AGKATGETAL FRTLFDQLKA GDLVLSDRYY 
GGWFMLALLQ ELGVEFVTRL HQFRIADFHQ GKRLGQRDHV VAWAKPQKPA WLDQATYDRL 
PDQLEVREIE VQVPVPGFRT ASLVVVTSLR DHRRFPREEL ALLYRRRWTV ELELRDIKAT 
MDLAVLRCTK PAWVRQELWT GLLAYNLIRQ SMLQSALGGE VRPEQLSFAA SLTNAGQYVV 
AGRDAARPYE NRCRTPHCAA NDQRLFASCR PPPGSNGAPR GQTPPQSHRP ARRTPRGRSQ 
SSPCGYQWKV VNAMTRC