Gene Plim_3741 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_3741
Symbol
ID	9140459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	4811209
End bp	4812465
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	56%
IMG OID
Product	hypothetical protein
Protein accession	YP_003631752
Protein GI	296123974
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCGAT TTCCTGCGGA TCGATCGGCA GGCGCTCCCC CTGGGACAAT GAACCCTCAG 
AACCGGTCGG CAACTGCTCC CCTTCTGACA AAGGGGACTC GAAAACCCGC GTGGAAGCAG 
CAGCAGTGGT TGATACCCAG TCTGATCTGG GGTTCGTTGG CAGCCGTTGT GCTGGGTATG 
CACTTTTACT TCCCCCCGAT TCCTGCTCCT CGAACTGCGA CGAGTTACAG TGCTTCTGCC 
GATGGTTTTA AGGCGTTGTA CGAGATTCTC GAACAGGATG CTTTTGTCTA TCGCAACGAT 
GCACCACTGG ATCGACTGAT GGAACTGGTT GACCCCGATG GCACACTCTT GTTGATTTTG 
AACCCGCCGC GAATTCCGAA TGAAGCCGAG TGGAACAGCC TCTATTCGTG GGTCAACATG 
GGTGGTCGCC TGGTCTATGC GCCTCCTCCG GGTGAAGTCG ACTCTTTGGG CCCATTCGAT 
GGCGAAATCA CGCCCGAACA AGGCCCGGCT GACGACCGCA TTCCACCGCA GTTGAACCTC 
CCCTTAGGAG GCCGGTTTCT GTGGTGGCCG GAAGGGGAAG TGACATCGAC TCCCGGCGGA 
AAGGTGCTTG TTTCTCAGGA TGGCTCGCCT CAGGCTGTCA TGGTGAATGC GGGGCGAGGG 
TCGGCTCTTT TTGTTGCCAG CCCGTGGATC TTTTCCAACC AGCTTCTGAC CTATGGCGAT 
AACAGTGCTC TGGCTTTTGA ACTGATTCGC GAAGCTGCCG GGCCGGGGCA AAGCCTGGAC 
GATGTCGTCA TCGCTTTTGA TGAATCTCTC AATACCCGGG CGACACCCCA GATGATGGGT 
GTCTTGTTTC AGCCGCCACT GCGTTCGATT TCCGTGCAGA TTCTGCTGCT GTTCATGCTC 
TATGGCTGGT GGAACAGTTG CCGGTTCGGG CCCACGGTTG TTCTCGAAGA AACGTCTCAG 
CGGGAAATCG TCGAACACAC CAGTGCTCTG GGGCGAATTC TCTGGCGATC AGCGGATTGC 
CAGTTCGTGC TATTTCAGTA TTTAAGGTAC TGGCTGACGG AATATCGACT GCAGGAAGCT 
TCCGGTCGCA AACGCCGCCT GTCGAGTCGC TTACAGAATG ATGCTCAACA GGTCGATCAG 
GCACTGGAAG CGATCCATCA GGCCGAGATC GCTGCGATGA CACCCCGGCT GGGCCATCGC 
GAAGCGGCAC GCCATATTCG AGCACTTTCA TTGATTGGCC AGAGCCTGCA GCGCTAA

Protein sequence

MSRFPADRSA GAPPGTMNPQ NRSATAPLLT KGTRKPAWKQ QQWLIPSLIW GSLAAVVLGM 
HFYFPPIPAP RTATSYSASA DGFKALYEIL EQDAFVYRND APLDRLMELV DPDGTLLLIL 
NPPRIPNEAE WNSLYSWVNM GGRLVYAPPP GEVDSLGPFD GEITPEQGPA DDRIPPQLNL 
PLGGRFLWWP EGEVTSTPGG KVLVSQDGSP QAVMVNAGRG SALFVASPWI FSNQLLTYGD 
NSALAFELIR EAAGPGQSLD DVVIAFDESL NTRATPQMMG VLFQPPLRSI SVQILLLFML 
YGWWNSCRFG PTVVLEETSQ REIVEHTSAL GRILWRSADC QFVLFQYLRY WLTEYRLQEA 
SGRKRRLSSR LQNDAQQVDQ ALEAIHQAEI AAMTPRLGHR EAARHIRALS LIGQSLQR