Gene Plim_4039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_4039
Symbol
ID	9140759
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	5181622
End bp	5182737
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	53%
IMG OID
Product	hypothetical protein
Protein accession	YP_003632049
Protein GI	296124271
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.970162
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTCACG TTGATCTTCC CTCTCGAGAT GATATTGCCA CCCTGATGAA TTCACGGGGT 
GAGATCAAGG TCAGCATTTA TCTTCCCACG ACGCCATTTT CTCAGCAGGC CCAGCAGGAT 
CGGATTGTCC TCAAAAATCT GACAAAAACT GCGATTGATC AACTGGCAGA GCGTCCGAAA 
AAAGATGTCG AAGCCATTGA AGGACTGCTT CTTGATCTGG TAGATGATGG ATCGTTCTGG 
GAATACCAGG CACATGGCCT CGCTATTTTT GTGACACCCA CACAGATTCA TACTTTAAGA 
CTTCCCTACA GCGTTCAAGA GCTGGTGGAA GTCAGTGATC GATTCCACGT CAAGCCATTG 
CTGCATCCAA TGGCGGCTTC TTCAACAGGC TTTGTCCTGG TGCTTGGTCA GAATAATGTC 
AAGCTGCTGC AGATCTGCTC CGACCTGCCC GCAGTGACAT TGAACATCGA CGGCTTGCCG 
AAGGATGCAG CAAGTTCTGT TGGCAAGTCG TCCATTCAGG ATCGCTCACC CAGCGGACGA 
ATTCAGGGAG ACGAAGGGAA GAAAGTTCGT CTCACACAAT ATGCACGCCT GGTTGATCAG 
GCACTCCGGC CGGTTCTCAA TGGACGCAGT GAACCTCTGA TTCTGGCAGC AACAGAACCC 
TTGCTTTCCA TTTACCGTCA GTTGGCAACG TATCCATTTC TTGCTGCCGA AGAAATTCGC 
CACAGCCCGG ATGCGATTTC CGATGTCGAG ATTGTGGCTG CCGCCCGCAC CATCTTCCAG 
AACCTCGCCA GTGCCCGCAT TCAATCGGCA CTCGAGACCT TCGAGCAGCG AAAAACACAA 
AATCGCACAA CTACTAATCT CGAAGAAATC TCCGTCGCTG CCACACAAGG CGCAGTGCAA 
TCCTTAATTG TCGATGTCGC CCGAGTCACC CCCGGGACCA TCGATGAGCA CGGCAAAATT 
ACGCCAGGTG CCGCCAATTG CCCGGTCAGT TACGATGTCG TCGGTGAAAT CTGTGCTCGC 
GTCATGATGA CCGGAGGGAC TGTCCTCGCA GCCGGAGGCG AACAGGTTCC CGGTACATGT 
GGGCTGGCAG CTACTCTTCG TTATGCTCCA CAGTAG

Protein sequence

MLHVDLPSRD DIATLMNSRG EIKVSIYLPT TPFSQQAQQD RIVLKNLTKT AIDQLAERPK 
KDVEAIEGLL LDLVDDGSFW EYQAHGLAIF VTPTQIHTLR LPYSVQELVE VSDRFHVKPL 
LHPMAASSTG FVLVLGQNNV KLLQICSDLP AVTLNIDGLP KDAASSVGKS SIQDRSPSGR 
IQGDEGKKVR LTQYARLVDQ ALRPVLNGRS EPLILAATEP LLSIYRQLAT YPFLAAEEIR 
HSPDAISDVE IVAAARTIFQ NLASARIQSA LETFEQRKTQ NRTTTNLEEI SVAATQGAVQ 
SLIVDVARVT PGTIDEHGKI TPGAANCPVS YDVVGEICAR VMMTGGTVLA AGGEQVPGTC 
GLAATLRYAP Q