Gene Plim_4103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_4103
Symbol
ID	9140823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	5262197
End bp	5263522
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	54%
IMG OID
Product	nucleotide sugar dehydrogenase
Protein accession	YP_003632113
Protein GI	296124335
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGGTC AACAGCTCGC CGAGAAACTG GGCAATCAAA CAGCGGTCAT TGGCGTCATT 
GGTTTGGGTT ATGTCGGTTT GCCATTGATC CGTGCTTTTA CATCTGCTGG TTTCCGGTGT 
ATGGGCTTCG ACGTGGATCA ATCCAAAGTC GATAAGCTCA ATGCCGGCCA GAGCTACATC 
AAGCATATTG ATCCCAGCCT GATCAAAGCA CTCATTACCG AAAAGAAATT TGAACCCACC 
AGCGATATGA GCCGCCTGCG TGAAGCAGAC TGCGTCATTA TCTGTGTCCC CACACCACTG 
AACGAGAGCC GCGATCCTGA CCTGAGTTAT ATCGAAGGGA CAGCCCATTC GATTGCCAAG 
GCTCTACGCC CTGGTCAACT CGTCGTTCTC GAAAGTACCA CACATCCCAC CACCACGCGG 
GTCAATGTGC TTCCAGTTCT CGAAGCGACC GGACTCAAAG CGGGTTCCGA TTTCTTCCTG 
GCATTCAGTC CTGAACGCGA AGACCCGGGC AACCCGACCT TCAGTGCCGA AGGGATTCCC 
AAAGTCGTGG GTGGCTACGA TCCCGTCAGT ACCGAACTGG CCTGCACGAT GTACAGCAAG 
GCTGTGGTAC GCGTGGTACC GGTTTCCAGC ATGGAAATCG CCGAAGCCTG CAAGATTCTC 
GAAAACACTT ATCGTGCCGT GAACATTGCC CTCGTCAATG AACTCAAGAT GCTCTACGAC 
AAAATGGGCA TTGATGTCTG GGAAGTCATC GACGCTGCCA AGACCAAGCC CTTCGGCTTC 
CAGGCCTTCT ATCCTGGCCC CGGCTTAGGT GGTCACTGCA TTCCCATCGA TCCGTTCTAT 
CTCACCTGGC TCGCTCGCAA GCATGGCGAA CAGACGCGCT TTATCGAGCT GGCTGGCGAG 
ATCAACGTGC ACATGCCGTC GTATGTCATT ACTCGATTGG CCGAGTTCCT CAACGACGCC 
GGTAAGCCGA TCAAGGGCAG CAAAATCTGC ATTCTGGGCG CTGCGTACAA GAAGGACGTG 
GATGATCCCC GCGAAAGCCC TTCCTTCGAA CTCATGAAGA TTCTCATCTC GCGCAAGGCC 
GATCTCAGCT ACAACGACCC CCACGTCCCG GTGCTCCCGA AAATGCGGCA CTACCCCGAC 
CTGCCTCACA TGGAAAGTCA GGAACTCACT CCCGAATTCC TGGCTTCACA AGACTGTGTG 
CTCATCTCGA CCGATCACTC GGCCTACGAC TATCAGTACA TCGTCAAGCA CTCGAAGTTC 
GTGCTCGATA CCCGTAACGC CACGAAGAAC GTCGTCGAAG GACGCGAAAA GATCCGCAAG 
GCGTAA

Protein sequence

MSGQQLAEKL GNQTAVIGVI GLGYVGLPLI RAFTSAGFRC MGFDVDQSKV DKLNAGQSYI 
KHIDPSLIKA LITEKKFEPT SDMSRLREAD CVIICVPTPL NESRDPDLSY IEGTAHSIAK 
ALRPGQLVVL ESTTHPTTTR VNVLPVLEAT GLKAGSDFFL AFSPEREDPG NPTFSAEGIP 
KVVGGYDPVS TELACTMYSK AVVRVVPVSS MEIAEACKIL ENTYRAVNIA LVNELKMLYD 
KMGIDVWEVI DAAKTKPFGF QAFYPGPGLG GHCIPIDPFY LTWLARKHGE QTRFIELAGE 
INVHMPSYVI TRLAEFLNDA GKPIKGSKIC ILGAAYKKDV DDPRESPSFE LMKILISRKA 
DLSYNDPHVP VLPKMRHYPD LPHMESQELT PEFLASQDCV LISTDHSAYD YQYIVKHSKF 
VLDTRNATKN VVEGREKIRK A