Gene Plim_3116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_3116
Symbol
ID	9139830
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	4035211
End bp	4036464
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	54%
IMG OID
Product	tryptophan halogenase
Protein accession	YP_003631130
Protein GI	296123352
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.406166
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCCAGA GCCTTGATCC TGAAGTGATT GTGATTGGTG GTGGCCCGGC GGGTGCAACA 
GCGGCGACAC TTCTGGCGCA GGCTGGTCAT CGCGTGCAGT TGTTCGAGCG GGAAGTTTTT 
CCGCGATTCC ATATCGGGGA ATCGCTGATT CCCTGCACCT ATGGAGTTTT TGCACGCACG 
GGGCTGCTCG AGCGACTGAA AGACAGCCAC TTCGTTAAGA AATACAGCGT GCAGTTTGTG 
AGTGATACGG GCAAAGTCTC GGCTCCATTT TTCTTTACAC AGTACAAGCC CGTCGAATCT 
TCGCAGACAT GGCAGGTGCG CAGAGCCGAT TTTGATCTGA TGCTGCTGGA TCACGCTCGC 
GAGGCGGGCG TGCAGGTTCA TGAGAATCAT CGTGTGCTGG AAGCGATCTT TGAAGACGAT 
CGATGCGTGG GAGTACGCGT CAAAAATGAG GCGACCGGTG AAGAGCGTCA GGTGCGAGCC 
CAGGTGGTGA TTGATGGGAG TGGCCAAAGC TCAGTGCTGC TCGATCGCCT GCAATTGAGG 
ACATGGGATA GCGAACTGAA AAAAGCCGCC GTCTGGACCT ACTACAAAAA TGCCTGGCGA 
GATGAGGGTG AGAATGGCGG TGCAACCTCT GTCATTCAGA CAGAAGGTAA GAAAGGCTGG 
TTCTGGTACA TCCCGCTGCA CGACAACATT ACCAGTGTGG GTGTTGTCGC AGATTTCTCG 
CATCTTTTTA ACAAGCAGCG CACAAAAGAC CTGGGAGAAC TCTTCCAGGA AGAGGTGGAT 
CACTGCCCGG GTGTGAAAGT TCGATTGGAG GGTGCCGAGC GATGTGATCA GTATCGGGCT 
GCCAAGGAAT ATTCCTATCG GGCAAAGCAG GCAGCAGGGC AGGGGTGGGT GCTGATTGGT 
GATGCCTATG GTTTTCTCGA TCCGCTCTAT TCTTCCGGTG TGTTGCTGGC CGTGAAATCG 
GGTGAACTGG CGGCTGATGC CGTCCATCAG GGCTTGGTCA CCAATGATTT AACCCGTACG 
ACACTCGGTG CCTGGGAGCC CGAGTATGTG CTAGGCATGG AGCGGATGAG AAAGCTGGTG 
CTGGCCTATT ATAAGGGTAT GAACTTTGGC AAGCTGATCA TGAAGTATCC GGAAACCAAG 
GACGATATTA CGGATCTGCT GATGGGCGAT CTCTTCCGCG CTGAACTGGA TCTAACACTC 
GATAAAGTCG ATTCAATGCT CGAGGAAATG GCTGCCCAAC CCGTGGTCGC CTGA

Protein sequence

MIQSLDPEVI VIGGGPAGAT AATLLAQAGH RVQLFEREVF PRFHIGESLI PCTYGVFART 
GLLERLKDSH FVKKYSVQFV SDTGKVSAPF FFTQYKPVES SQTWQVRRAD FDLMLLDHAR 
EAGVQVHENH RVLEAIFEDD RCVGVRVKNE ATGEERQVRA QVVIDGSGQS SVLLDRLQLR 
TWDSELKKAA VWTYYKNAWR DEGENGGATS VIQTEGKKGW FWYIPLHDNI TSVGVVADFS 
HLFNKQRTKD LGELFQEEVD HCPGVKVRLE GAERCDQYRA AKEYSYRAKQ AAGQGWVLIG 
DAYGFLDPLY SSGVLLAVKS GELAADAVHQ GLVTNDLTRT TLGAWEPEYV LGMERMRKLV 
LAYYKGMNFG KLIMKYPETK DDITDLLMGD LFRAELDLTL DKVDSMLEEM AAQPVVA