Gene Plim_2000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_2000
Symbol
ID	9138702
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	+
Start bp	2595031
End bp	2596218
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	54%
IMG OID
Product	hypothetical protein
Protein accession	YP_003630029
Protein GI	296122251
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGATC CAACGCCGAT TACGACTTTC GAGCCCGAAC CTGAACCCGA GCGACCAGCG 
GCTGGAGGCA GCTCACGAGT CATCAACGAT GGTCAGGCTC GTGTCTTTCC TTGCAGTCAA 
TGCGGGGCTG ATCTCGAATT CCGGATTGGT ATCCAGCAGC TTCAGTGCCC ATTTTGCAAT 
CATGTGGAAC AACTGGAGAT CCCTGCCGAT GCTGCCATCG TCGAGCAGGA TCTCGACGCC 
ATGCTTGAGC GATTGCAAGA GCAGCATGGA GATCTCGAAT CCGCGGAAGG AGAGGTCAAT 
AGTGCCACCG TCGGCGACCA GGAAGTTCAT TGCGATGGTT GCGGCGCAAA CGTCCTCTTC 
GTGGGCACTC TCACCAGCAG CCGCTGCCCT TACTGCGGCA GCCCAATTCA ACGTAATGAT 
GTCCATAAAT CCGCAGCTCG CATTCCGGTC GATGGGGTGC TTCCCTTTTT TATCGTTCGC 
GAGAAAGCCG CCAGTTGTAT CGAGCAGTGG GTTCAATCCC GCTGGTTCGC TCCTAACGAT 
TTCAAGAAAC TGGGAGCCAA AGGGAAATTC GAAGGCGTTT ATCTCCCTTA TTTCACATTC 
GATGCCATGA CATTTAATCG TTATCAGGGC GAACGTGGCG ATCGCTACAC TGTCACTGTC 
GGAACTGGTA AAGATCGACG CACTGAAACC CGCACAAGAT GGTCTTACGC TTCCGGTCAG 
TTCCAGCGAT TCTTTGACGA TGTGCTGATT CTCGCGATTC GTTCGCAGCG ACATGATCTT 
GCTCAGCATC TGGAACCCTG GCCTCTGGAA AAATGCGTCC CCTTTACCCC CGATGCCATG 
GCTGGAATTT TTGCGAGAAC GTATGACATT CCGCTCGATC AATCGTTCGA ACTGGGCCAG 
CAAAGAATGC GGCAAGCCTT AATGGCCGAA ACCCGCCAAA GGATTGGTGG CGACGAGCAA 
CGTGTCCATG ACCTGAAAAC TCAGTTTACG GCACTCACGT TCAAACACCT TCTGTTGCCT 
GTCTGGTTGC TGGCCTACCG CTATCGCGAC AAGACCTACC CCGTCATGGT GAATGCCGTC 
ACAGGCGAAG TGAGTGGCGA TCGCCCTTAC AGTTGGATCA AGATTACTCT GGCCATCCTC 
GCTGCGGCAG CCGCGGCATT GACTCTGTTT GCATTGACAC AAAAGTGA

Protein sequence

MSDPTPITTF EPEPEPERPA AGGSSRVIND GQARVFPCSQ CGADLEFRIG IQQLQCPFCN 
HVEQLEIPAD AAIVEQDLDA MLERLQEQHG DLESAEGEVN SATVGDQEVH CDGCGANVLF 
VGTLTSSRCP YCGSPIQRND VHKSAARIPV DGVLPFFIVR EKAASCIEQW VQSRWFAPND 
FKKLGAKGKF EGVYLPYFTF DAMTFNRYQG ERGDRYTVTV GTGKDRRTET RTRWSYASGQ 
FQRFFDDVLI LAIRSQRHDL AQHLEPWPLE KCVPFTPDAM AGIFARTYDI PLDQSFELGQ 
QRMRQALMAE TRQRIGGDEQ RVHDLKTQFT ALTFKHLLLP VWLLAYRYRD KTYPVMVNAV 
TGEVSGDRPY SWIKITLAIL AAAAAALTLF ALTQK