Gene Plim_4196 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_4196
Symbol
ID	9140917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	5367167
End bp	5368267
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	55%
IMG OID
Product	glycosyl transferase group 1
Protein accession	YP_003632203
Protein GI	296124425
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCTCTT CGAACTTCCA GTTTCGGGGG AGTTCGGTCT ACACCCTCAG GCTGGCCGAA 
CGATTGCCTG AATACGGGTT TGTTCAGAGT ATTGTCTGCC CCGGTGCCTC GACGGTTGAT 
CTGGCGCGTC GCAAGGCGTT GGGCATTGAA GTGCTCCCTT ATCTTGAAGC ACCCGCCTGG 
AAGTGGGTTG TGCTGGAGCT TTATTGCCGC AAACTTCTGG CCCATCCCCC TGATCTGATT 
CATATTCAAT CACGCACAGC GATGTGGCAT GGTGAATGGA TTGCCCGCCG GCTCAATCGA 
CCTTATGTGC TCACAGTTCA CGATTACATG CAGAGTCATG AATTTCTGCA GCCTGATCTC 
GCTTTATGCC GGCGGATAAT CACTGTGAGT GAATCGGTCA AAGCGGCACT TGTCGAGCGA 
TCGGGGCTGC CGGAAGATCT CTTTGTGGTC ATTCCCTGTG GTGTGCCTCG GGCCAGTGAT 
GAAGATAAAT CGCTGGTCTT GAAATCAGGG AAAGTTCCCG TGGTTGGTAC GGCAGGCCCC 
CTGGAGGCTG TCAAAGGGTT TCCGTTTTTT CTCGCTGCGG CAGCCCACGT GCTCGGGACA 
CATCGCGACG TCGAATTTTT GATTGCGGGG GCCGGGCCGG AAGAGACCAG TTTACGCAAG 
TTAGCCCGCA CGCTGGGTAT TCATGAACAT GTGACATTTG TGCCAAATCT GCTCGATTTT 
TCTGATGCGT TAAGTGCCAT GGATATCTTT TGCCTCCCTT CGCTGCAGCA GGGGATTGGC 
ACCATCATGC TCGAAGCGAT GGCCATGGGC CGTCCGGTGA TTGCGACGAG TGTGGGAGGC 
GTCTTCAACG TCGTTCGCGA CAATCAGACA GGGCTGCTGG TCCCTCCATC AGACAGTGTC 
CGTCTGGCCG AAAGAATCAT TGAACTGCTT ACCAATCCCG AATTAGCCCG CAGAATTGGT 
GCTGCTGCCA TGCTCGAAGC CGAGACCGAG TTCAATGTTG AACATATGGT GGAAGCGACA 
GTCGAGGTCT ACCGTGAAGT TCTCGACGAG CGCATGGCGG GTTTGACCAC CGTTGCCATC 
CCCCAGCTCT CGAAACGATA G

Protein sequence

MVSSNFQFRG SSVYTLRLAE RLPEYGFVQS IVCPGASTVD LARRKALGIE VLPYLEAPAW 
KWVVLELYCR KLLAHPPDLI HIQSRTAMWH GEWIARRLNR PYVLTVHDYM QSHEFLQPDL 
ALCRRIITVS ESVKAALVER SGLPEDLFVV IPCGVPRASD EDKSLVLKSG KVPVVGTAGP 
LEAVKGFPFF LAAAAHVLGT HRDVEFLIAG AGPEETSLRK LARTLGIHEH VTFVPNLLDF 
SDALSAMDIF CLPSLQQGIG TIMLEAMAMG RPVIATSVGG VFNVVRDNQT GLLVPPSDSV 
RLAERIIELL TNPELARRIG AAAMLEAETE FNVEHMVEAT VEVYREVLDE RMAGLTTVAI 
PQLSKR