Gene Plim_3720 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_3720
Symbol
ID	9140438
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	+
Start bp	4783172
End bp	4784464
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	57%
IMG OID
Product	protein of unknown function DUF1501
Protein accession	YP_003631731
Protein GI	296123953
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCCAG TCATTCACGA TCTTGTTCAG CTTTCGAGAA ACCACTTTAC CCGCCGACGT 
CTGCTGCAAT CTACTGCGGC TGGGATGGGT GCGATGGCTG CCGGTGGTTT GCTGCCAGCT 
TGTCTGTCGG CTCAGGCGGC TGATCTGCAG CAGAAGAAGC GTTCGATCAT TGTCCTCTGG 
ATGCAGGGAG CACCCAGCCA GTTCGAGACC TTCGATCCCA AGCCTGGTAC GGAAACAGGC 
GGCCCTACGA AGTCCATCTC GACAGCCGCC CCGGGAATTC AGATTGCCTC GACCTTCCCG 
CAAGTTGCGA AAATGATGAA CGAGATTGCC CTGATCCGTT CACTCACGAA TAAAGAAGGG 
AATCATCAGC GGGCGACTTA CCAGTTGCAT ACAGGCTACA TTCCCACCGG TTCGGTCAAG 
CATCCTTCAC TGGGGGCGAA TATCTCCCGA CAGATTGCTC CTGCCGGGCA GGATCTGCCG 
TCGCTGGTCA CCATCGGGAA TGCGATAGCC GGGATTGGTG CTGGGTATCT GGGAATCAAC 
TACGAGCCGC TGCACCTCAA TCAGGCCGGT AAGATTCCCG ATAACGTCAC GATTGGAACG 
AGTACCGAAC GCTTTGACCG ACGGCTGGGT CTACTCGGCC AGATGGATCA GCAGTTTGCC 
GAACGTGGTG GAGCCTCTGT CGTGCAGACA CATCGCGATC TCTACTCAAA GGCATCAGGG 
ATGGCTCAGT CGAAGGATCT GAAGGTCTTC GACCTCGATG AAGAACCAGC CGCTCTCAAG 
GAGGCTTATG GCGATACCAA CTTTGGGCGT GGTTGCCTTC TGGCGCGCCG TCTTGTTGAA 
GCAGGTGTCA CTTATATCGA AGTGCGCGTG GGGAACTGGG ATACCCATGC CGATAACTTT 
GATGCGACGA CCCGGCTGGC TGGGGAAGTT GATCCGGCGG CAGCCACTTT GATTCGAGAC 
CTCAAAGACC GTGGCCTGCT CGATTCGACA CTCGTGGTCT GGATGGGTGA GTTTGGCCGC 
ACTCCCAAAA TCAATGCCCG CACAGGTCGC GATCACTTCC CGAAAGCATT TAACGGCTTC 
CTCGCGGGAG CCGGTATTCG CGGTGGTCAG GTGATTGGAC GCACCAACGC CGAGGGGACA 
GAGATCGAAG ACCGACCAGT GACTGTGGGT GATCTCTTCA CATCGATCTG TGCGGCTATG 
AAGGTCAATC CCAAGGATGA AACCATGAGC CCCCAGGGCC GACCTCTCAA GGTCATTGAA 
TCGGGCGAAG TGATTCAAGG ACTCTTCGCC TGA

Protein sequence

MSPVIHDLVQ LSRNHFTRRR LLQSTAAGMG AMAAGGLLPA CLSAQAADLQ QKKRSIIVLW 
MQGAPSQFET FDPKPGTETG GPTKSISTAA PGIQIASTFP QVAKMMNEIA LIRSLTNKEG 
NHQRATYQLH TGYIPTGSVK HPSLGANISR QIAPAGQDLP SLVTIGNAIA GIGAGYLGIN 
YEPLHLNQAG KIPDNVTIGT STERFDRRLG LLGQMDQQFA ERGGASVVQT HRDLYSKASG 
MAQSKDLKVF DLDEEPAALK EAYGDTNFGR GCLLARRLVE AGVTYIEVRV GNWDTHADNF 
DATTRLAGEV DPAAATLIRD LKDRGLLDST LVVWMGEFGR TPKINARTGR DHFPKAFNGF 
LAGAGIRGGQ VIGRTNAEGT EIEDRPVTVG DLFTSICAAM KVNPKDETMS PQGRPLKVIE 
SGEVIQGLFA