Gene Plim_2839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_2839
Symbol
ID	9139551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	3674785
End bp	3676356
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	50%
IMG OID
Product	glycosyl transferase family 2
Protein accession	YP_003630860
Protein GI	296123082
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCTGGT TAATTGTTGC CGGGTTGATT GCTGTCACGT TGCTCACATT TGTGATGACA 
ATCGCGCAAC TCGACCTGTA CCGTCGCTAC TGGCTCTCGG TACTTCGCAA AGATCGCCAG 
CGCGAGGTAC CACCCCTTCC TGAGTCACTA CCGCGAGTGA CCATACAACT CCCCATTTAC 
AATGAGTCTC CCGTCGTTCA TCGACTCCTC GAAGCCGCTT CACGAATTGA CTATCCTCAT 
AATCTCTTAC AGATTCAGGT GCTTGATGAC TCGACAGATG ACTGCTCGAA AATTCTCGTC 
GACAAAGTCG CCGAGATTCA ACAGCGAGAT CCCAGCCTGA ACATCCAGTA TCGACATCGC 
ATCGATCGTA CAGGTTACAA AGCCGGAAAT CTGGATGAAG GGACCACCTG GGCGACAGGT 
GAGTTCATGG CCATTTTCGA TGCTGATTTT GTACCGAAAC CAGACTATCT TCAGCAGACC 
ATCCGCTACT TCCAGAACGA AGAAATTGCT ATCGTTCAAA GTCGATGGGG ACACCTGAAT 
CCTGACTCGT CAATTGTGAC TCGAGTTCAG CAATTCTTTC TGGATGGACA TCTTTCGGTC 
GAGCAGAGAG GGCGAGGCGA TAGCGATCTG TTTTTGATCT ATAATGGATC CGCTGGCATC 
TGGCGAAAAC AGGTCATCGT CGATTGCGGC GGCTGGATGA CAACGGCCGC CATTGAAGAC 
GTGGATATGA GTTATCGAGC CCAGTTGCGC GGAAAAAAGA TTGTCTATCT CGAAGACTAC 
ACGACACCAG GTGAGTTACC CGATTCAATG ATCGCCCTCA GGCTGCAACT CTTCCGCTGG 
TGGAAGGGAA ATCTGCAGAT CGCTATTAAG TATATTCGCC AGGTCTGGCA AAGTGATTAC 
CCGCTTATCA AGAAGCTACA TGCCACGACA CACCTGTTTG GCCCTCTGAT GTCCGCAGTA 
ACATTTGCGA ATATTATTCT CGCAGGGGCT GTGCCGCTGA TTGTGACGTG GTACCCGGAA 
ACTCGCTATT GGTTGGCATC GACACTACTG GGGGTAGCAC TCATTCCCGT CCTGTTTCTA 
GTTTACGGCA CCGGAAGAAT CCGTTTTGGT GAAGGCAGTC GTTGGCAAAA GATATTGGGT 
ATCATTCCTT TGGGAAGCAT GCTGATGGTG CTGCATTCCG GACTATCGTG TCAGCATACG 
GTCTCTGCTT TTGAGGCTTT TTTCGTTAAG AAGAATGTCT GGGTCGTCAC TCCCAAAGGG 
TTTTCCAGCA CAGGCGCAAC ACAGGCAAAA CGTCGCCGCA TCAAGATTCC ATGGTATTTC 
TGGCTGGATG CACTAGTCAT TATCTACCTC ATCGGCTGCG GCTGGATGGC CTTGATGTTT 
CAGTTTTATA TGATTGCGGC CCTGCAGGTG CTTTGGATCT GTGGCTTTCT TTGGGTTCTG 
GGTGGATCTT TGTGGGAGGC GAACAAAGAC CAGAGAGCCT TCTCTTTGTC ATCTACCCAA 
AAAGATCGTT TAGAAAACAC AGCGGCAGAA CTCACACCTG GCCCACTGGA GAGTGCCAGT 
CTAGCGTCTT GA

Protein sequence

MVWLIVAGLI AVTLLTFVMT IAQLDLYRRY WLSVLRKDRQ REVPPLPESL PRVTIQLPIY 
NESPVVHRLL EAASRIDYPH NLLQIQVLDD STDDCSKILV DKVAEIQQRD PSLNIQYRHR 
IDRTGYKAGN LDEGTTWATG EFMAIFDADF VPKPDYLQQT IRYFQNEEIA IVQSRWGHLN 
PDSSIVTRVQ QFFLDGHLSV EQRGRGDSDL FLIYNGSAGI WRKQVIVDCG GWMTTAAIED 
VDMSYRAQLR GKKIVYLEDY TTPGELPDSM IALRLQLFRW WKGNLQIAIK YIRQVWQSDY 
PLIKKLHATT HLFGPLMSAV TFANIILAGA VPLIVTWYPE TRYWLASTLL GVALIPVLFL 
VYGTGRIRFG EGSRWQKILG IIPLGSMLMV LHSGLSCQHT VSAFEAFFVK KNVWVVTPKG 
FSSTGATQAK RRRIKIPWYF WLDALVIIYL IGCGWMALMF QFYMIAALQV LWICGFLWVL 
GGSLWEANKD QRAFSLSSTQ KDRLENTAAE LTPGPLESAS LAS