Gene Slin_0284 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_0284
Symbol
ID	8724012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	375003
End bp	376613
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	51%
IMG OID
Product	metal dependent phosphohydrolase
Protein accession	YP_003385147
Protein GI	284035217
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.876396
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACATTC CAATTTTGTT AACGATTCTT GCCGCCCTTG CAGGGGGTGG TATTGGCATA 
TTAATTGGTC GCCAAACCAT GGCGGGCGTT CGCGCGAAGC ATGAGAAAGA TGCAGAAGAA 
AAAGCAGCAG CTATTTTAAA AAATGCTGAA TTACAGGCCG AAACGATAAA AAAAGATCGG 
ATACTGGAAG CAAAAGAAAA ATACCTGAAG CTGAAAACGG AGTTCGAAGA AACAACAAAT 
CAGAAGCGGA ACCTGCTTCT GCAGAACGAA ACCAAGCTCA AACAGCGCGA ACAACAACTT 
GCCCAACAGG CCGATCAGCA GCGCACCCGT GAAGGTGAGC TGAACCAGCA GCGTAATGAA 
CTCGGGCAGC AAAAAAACAC GCTAGCGCAA CAGATTGAGG CTCTTAATAA ACGCCGGGAA 
GACGTTGACC GTCGGCAGCA GGAAGCCGAC CGTATGCTCG CCGATCAGGT GGCTCAGCTC 
GAAAAAATTG CAGGTCTGTC TGCCGAGCAG GCACGTGAGC AACTCATAGA AACGCTGAAA 
GCCGAGGCCG AAACACGGGC TTCCTCCTAC ATCAAAAATA TTATTGAAGA AGCTAAGCTG 
ACCGCTACTA AAGAAGCGAA AAAGGTGGTT ATTGAAACCA TTCAGCGAAC GGCTACCGAG 
CACGCCATTG AAAACTGTGT GTCCGTTTTC AACATTGAAT CGGATGATGT AAAGGGCAAA 
GTTATTGGCC GGGAAGGTCG TAACATTCGT GCCCTCGAAG CAGCAACCGG CGTTGAAATT 
ATCGTCGATG ATACCCCCGA AGCCATTATC ATTTCGGGCT TCGATCCCGT TCGGCGCGAG 
ATTGCCCGGC TCTCCCTGCA CCGGCTCGTA CAGGACGGTC GTATCCACCC CGCCCGGATT 
GAAGAGATCG TTGCCAAAAC CCGCAAAAAT ATTGAAGACG AAATTGTTGA GATCGGCGAA 
CGGACTGTCA TCGACCTCGG CATTCACGGT CTTCACCCCG AGCTGATCAA GATGGTTGGC 
CGAATGCGCT TCCGGTCAAG TTACGGGCAA AACCTGCTCC AGCACTCCCG CGAAGTAGCC 
AAACTGTGCG CCACTATGGC GGCTGAACTG GGCCTGAATG CCAAGCTCGC CAAGCGGGCT 
GGATTGCTTC ACGATATTGG CAAGGTGTGG CCCGAAGAAG CTGAACTACC CCACGCCATA 
TTGGGCATGG AGCTTGCCAA GAAATACAAG GAGAATCCGG AAGTTATCAA TGCTATCGGC 
GCTCACCACG ACGAGATCGA GATGACGAGT ATGATTTCGC CAATTGTGCA GGTTTGTGAC 
GCCGTATCGG GCTCACGGCC GGGTGCCCGT CGCGAGATGA TGGAGTCGTA CATTAAACGA 
CTTAAAGAAC TGGAAGAACT GGCCGGAAAT TTTCCGGGCG TAACCAAGTG CTATGCTATT 
CAGGCCGGTC GCGAGTTACG GATTATGGTC GATGCTGATC ATGTTTCCGA TGAGCGTGCG 
GGTATTCTGT CGTATGAAAT TTCACAAAAA ATAGAGAAGG AGATGCAGTA TCCCGGTCAG 
ATCAAAGTAA CGGTCATCCG GGAAATGCGG GCAGTAGCCT ACGCCAAGTA G

Protein sequence

MDIPILLTIL AALAGGGIGI LIGRQTMAGV RAKHEKDAEE KAAAILKNAE LQAETIKKDR 
ILEAKEKYLK LKTEFEETTN QKRNLLLQNE TKLKQREQQL AQQADQQRTR EGELNQQRNE 
LGQQKNTLAQ QIEALNKRRE DVDRRQQEAD RMLADQVAQL EKIAGLSAEQ AREQLIETLK 
AEAETRASSY IKNIIEEAKL TATKEAKKVV IETIQRTATE HAIENCVSVF NIESDDVKGK 
VIGREGRNIR ALEAATGVEI IVDDTPEAII ISGFDPVRRE IARLSLHRLV QDGRIHPARI 
EEIVAKTRKN IEDEIVEIGE RTVIDLGIHG LHPELIKMVG RMRFRSSYGQ NLLQHSREVA 
KLCATMAAEL GLNAKLAKRA GLLHDIGKVW PEEAELPHAI LGMELAKKYK ENPEVINAIG 
AHHDEIEMTS MISPIVQVCD AVSGSRPGAR REMMESYIKR LKELEELAGN FPGVTKCYAI 
QAGRELRIMV DADHVSDERA GILSYEISQK IEKEMQYPGQ IKVTVIREMR AVAYAK