Gene Plim_1928 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_1928
Symbol
ID	9138630
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	2516040
End bp	2517170
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	52%
IMG OID
Product	biotin synthase
Protein accession	YP_003629957
Protein GI	296122179
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000208086
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGCAA CTGGGTCTTC GAAAGAAAAC TGCTCCACAA AGATTTGCTG GAGTGATCTT 
GCTGACAAAG TGATGGGCGG GCACGTGCTG ACCCGTGAGG AAGCTCTAGC CATTCTGGAT 
TCAGAAGACG ATGAGATCGT GGATCTGCTG GCAGCTGCTT ACAAAGTGCG GCGTAAGTAT 
TTCGGGAATA AAGTTCAGCT TTACTTCCTG AAAAATGCCA AGAGTGGTCT CTGCCCAGAG 
GATTGTGGTT ACTGCTCTCA ATCCAAGATT GCCGAAACTG AAATTCCTAA GTATGCCATG 
CTGAATGAAG CCAAGCTCAT GGAAGGAGCA GCGCGAGCTG TCGAAGCCAA GGCCCGAACC 
TATTGCATCG TGGCTTCAGG ACGCGGCCCT TCCAACCGAG AAGTAGGGCA TGTCGCCAGC 
GTTGTCAAGA AAATCAAAGA GACCTATGGA CTGCATATCT GCTGCTGCCT GGGTCTGTTA 
TCGCCCGATC AGGCCAAAAC ATTAGCAGAA GCCGGGGTTG ATCGGATCAA CCATAACCTG 
AACACAGGTC GCGAGTTTTA CGACAAGATC TGCACGACTC ATACCTATGA TGACAGGCTG 
GAAACACTGA AGGTGGTTCG TGAAGCCGGT ATGGAGCTAT GCAGTGGCCT GATTGTGGGC 
ATGGGTGAAA CCCAGAACGA TCTGGTTGAT GTCGCTTTTG AATTGCGGGA ACTGGGTGTG 
GAATCGACCC CGGTCAATTT TCTGCATGCC ATCGATGGTA CTCCTCTCGA AGCTCGGCAG 
GAATTGAATC CCCGCCAGTG CTTGAGAGCT TTGTGTCTGT TCCGCTTTGC CAATCCGGCT 
GTGGAACTGA GAGTTTCCGG CGGACGTGAA GTGAATCTGA GGTCGATGCA GGCGATGAGC 
CTGTATGCTG CCAACAGTAT GTTCGTCAGC GACTATCTCA CGACTAAAGG GCAGCCGGCT 
GAAGATGATT TCAAGATGGT AGCCGACCTG GGGATGGAAG TCGTGATCGG TGATCATGAC 
TCTTTTCTCG CATGGAAGGC AGTTCAGGAA AGTCAGCCCC AAACCAATTG CTGCGAGGGA 
ACTTCGACCT GTGTAACCCC TGAGAAAACA GCGGCAGGTT GTCATGCCTA G

Protein sequence

MSATGSSKEN CSTKICWSDL ADKVMGGHVL TREEALAILD SEDDEIVDLL AAAYKVRRKY 
FGNKVQLYFL KNAKSGLCPE DCGYCSQSKI AETEIPKYAM LNEAKLMEGA ARAVEAKART 
YCIVASGRGP SNREVGHVAS VVKKIKETYG LHICCCLGLL SPDQAKTLAE AGVDRINHNL 
NTGREFYDKI CTTHTYDDRL ETLKVVREAG MELCSGLIVG MGETQNDLVD VAFELRELGV 
ESTPVNFLHA IDGTPLEARQ ELNPRQCLRA LCLFRFANPA VELRVSGGRE VNLRSMQAMS 
LYAANSMFVS DYLTTKGQPA EDDFKMVADL GMEVVIGDHD SFLAWKAVQE SQPQTNCCEG 
TSTCVTPEKT AAGCHA