Gene Slin_3446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_3446
Symbol
ID	8727199
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	4178501
End bp	4179649
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	51%
IMG OID
Product	histidinol-phosphatase
Protein accession	YP_003388253
Protein GI	284038323
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAAAA TAGTATTTAT TGACCGCGAC GGGACGCTTA TTGCCGAGCC ACAACCCGAT 
CAACAGGTTG ACTCACTCGC CAAACTGGAT TTCATTCCAA AAGCTATTTC GGCCATGCGG 
AAAATTGCCG AAGATACTAC GTATGAACTC GTTATGGTCA CTAATCAGGA TGGACTGGGT 
ACCGGCTCCT TCCCCGAAGA TACGTTCTGG CCAGCTCATA ACAAAATGAT GTCCACATTT 
GCCGGCGAAA ACGTCAACTT TGCGGCTGTG CATATCGACC GTCATTTCCC GCACGATAAT 
TCGTCTACCC GGAAACCCGG CGTTGGTATG TTAACGCAGT ATTTCGAGGC TTCGTATGAC 
CTGACCAACA GTTTCGTTAT TGGTGACCGG CTAACCGATG TTCAACTGGC TGTAAATCTG 
GGTGCTAAAG CTATCCTGTT CATGCCCCCC AACGGATTAG CAGCCGTACA ATCCGCTGAT 
GTCAGTGGGT TGACCGAAGC CATGAAACAG GCCATTGTAC TCCAGACCGG CGACTGGGAC 
GAGATCTACG AATTTTTGCG CCTGCCCGCC CGCACGGCCC TTGTTGAGCG GAATACAAAA 
GAGACGCAAA TCCGCGTGGA GTTAAACCTC GATGGCCGGG GCCGGGCCGA TATGCATACC 
GGGCTTGGCT TTTTCGACCA CATGCTCGAT CAGGTAGCCA AACATTCGGG TGCCGACCTG 
GCGATCCATG TCAACGGAGA TTTGCACATT GATGAACATC ACACGATAGA AGACACGGCC 
CTGGCGCTCG GTGAAGCCTA TCGACGTGCC TTAGGCGATA AACGTGGCAT CAGCCGTTAT 
GGGTTCCTGC TGCCAATGGA TGAAGCCCTG GCGCAGGTGG GCATTGATTT TTCGGGCCGT 
CCGTGGCTGG TTTGGGATGC CGAGTTCAAG CGGGAGAAGA TCGGCGACAT GCCAACCGAG 
ATGTTTTATC ATTTCTTTAA ATCGTTTTCC GATACAGCAC TTTGCAACCT AAACATTAAA 
GTGGAAGGCG ATAATGAACA CCATAAAATC GAAGCCATTT TCAAGGCGTT CGCCAAGGCG 
ATAAAAATGG CCGTTCGACG CGACATCAAT GAATTAGATA ACCTTCCCAG CACGAAGGGC 
GTTTTATAA

Protein sequence

MQKIVFIDRD GTLIAEPQPD QQVDSLAKLD FIPKAISAMR KIAEDTTYEL VMVTNQDGLG 
TGSFPEDTFW PAHNKMMSTF AGENVNFAAV HIDRHFPHDN SSTRKPGVGM LTQYFEASYD 
LTNSFVIGDR LTDVQLAVNL GAKAILFMPP NGLAAVQSAD VSGLTEAMKQ AIVLQTGDWD 
EIYEFLRLPA RTALVERNTK ETQIRVELNL DGRGRADMHT GLGFFDHMLD QVAKHSGADL 
AIHVNGDLHI DEHHTIEDTA LALGEAYRRA LGDKRGISRY GFLLPMDEAL AQVGIDFSGR 
PWLVWDAEFK REKIGDMPTE MFYHFFKSFS DTALCNLNIK VEGDNEHHKI EAIFKAFAKA 
IKMAVRRDIN ELDNLPSTKG VL