Gene Smon_0124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smon_0124
Symbol
ID	8599822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptobacillus moniliformis DSM 12112
Kingdom	Bacteria
Replicon accession	NC_013515
Strand	+
Start bp	130972
End bp	132756
Gene Length	1785 bp
Protein Length	594 aa
Translation table	11
GC content	22%
IMG OID
Product	Heparinase II/III family protein
Protein accession	YP_003305494
Protein GI	269122917
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTTAACT TTAGTAAAAA TTTTAAATAT ATTTTACATA ATTTTGATGT AAGTATGTAT 
CTTGAGCAAG CTGAAAACAT ATTAGAAAAT AGACTTAAAT TCATTCATCC ATGGGATATG 
GAAAGAACTT CACAATATTT TGATATTCCA AAAGATTGGA ATGATTATGT AAATGATGAT 
GAAGAATGGA TATTTATGAG AAGTAGAATG AACTATTTTG ATTCCCTATT TCTTGCTTAT 
GAAAAAAGTA AAGATAAAAA ATATTTAAAT AAGATAAAAG AAATAATTTT TGATTTCATT 
AATACTCATA AAACTTTAAA ATTTGAATTA AGCACAAGAA CTTTAGATAG TGGGATAAGG 
ATAATAAATA TATTAAAAGC ATTAATATAT TTAAAAGAAT TAAAATGTCT TAGTGAAGAT 
GAAGAAAATG ATATAGTAAA TCATTTAGAT AAAACTTGTA TATATTTATT TAATTCATTT 
ATAGAAAAAT ACTATCATAG CAATTGGGGA TATATACAAA TGGCAGGAGT ATATACTTTT 
GCACTTATGT ATAATAAAGA ATATGTTAAA AAAGCAAAAG AATATATGAA AATACAGCTT 
AAAACACAAA TAGATGATGA TGGATTACAT ATAGAAAAAT CAATGACATA TCATTATCAA 
ATGTTAATTT ATACAGCATG GGTAGTGATG ATAGAAAAAA ATGTTGGTAT AAATAAGACC 
TTATTTACTA AATATTTAAA AAAGATGCTT GAAGCAGCAG AAAAATTACA TTATCCAAAT 
TTTAGACAAA TTAATTTTGG TGATAGTGAT GATGATAATG TAGAAGATAT TTTATCAATG 
GCAAATGCAA TTTTAAAAAG AAATGCAAGA TATAGGCTAA AGGAAAGCTC ATATATGTTT 
GCAGGAGATT TTGTTTGTGG ATACAAGATA AATAAGGCAA ATGATAAAAG AAGAGAATAT 
CTATTAAAAG AAAGTGGTTA CTATAATTTG ATAGATAAGA ATTATTCTTT TAGTACTTAT 
TTAACTAATA TGACTTCTGG GCATTTACAT GTTGATTTAT TTCATTTTAA CTATTTTAAC 
AAAGTAGAAA TGTTGGTTGA TAATGGAAGA TATACATATT TAGATAATGA ATATAGGAAA 
TATTTAAAAA GTTCTTATGC TCACAATACA TTAGTGTTAG ATAATAAGGA GTTTTTAGCT 
ATTAAAGATT CATGGGAATA TATAGGTAAA TACCCTTTAA TAAGCCCTAT ATATAAAATT 
GAAGATAAAG GTGTAACTTG CATTAAAATG AATGTTTTTG ACATAGAAAC TAATTCATAT 
ATAGAAAGAA AATTTATACT TTGTGAAGAT AATGTGATAA TAATAAATAG AATATATTCT 
AAAGGTAAAC ATAATTTAAA AATGTATTAT CATTTCCATC CTAGATTAGA AATAGATGGA 
GAAAAAGAAA GACTTTTATT AAATAAGGAA ATATATTTTA ATATAGGGGA ATATATAATG 
GGGGAAGGTA TATATAGTAG TAGATATAAT GAGAAAGAAA AAAGTAAGTT TGTCAAACTA 
GAATATGATT TTAATGATAA TATTCAAATA ATTCATAAGA TATTAAATAA AAATATACAA 
TTTGAAGAAA TATGTTGCGA AAATAGTATA TATTCTTGTA AAATTATTTC AGGAAATAAA 
GAATATATGA TTTTTTGTAA AAATGAAGAT AGCATAGAAA AGCAAAATGT TCTATATATT 
CAAAATAATC TTTTATATAA AAATTTTAAG GTGGTTGTAA AATGA

Protein sequence

MFNFSKNFKY ILHNFDVSMY LEQAENILEN RLKFIHPWDM ERTSQYFDIP KDWNDYVNDD 
EEWIFMRSRM NYFDSLFLAY EKSKDKKYLN KIKEIIFDFI NTHKTLKFEL STRTLDSGIR 
IINILKALIY LKELKCLSED EENDIVNHLD KTCIYLFNSF IEKYYHSNWG YIQMAGVYTF 
ALMYNKEYVK KAKEYMKIQL KTQIDDDGLH IEKSMTYHYQ MLIYTAWVVM IEKNVGINKT 
LFTKYLKKML EAAEKLHYPN FRQINFGDSD DDNVEDILSM ANAILKRNAR YRLKESSYMF 
AGDFVCGYKI NKANDKRREY LLKESGYYNL IDKNYSFSTY LTNMTSGHLH VDLFHFNYFN 
KVEMLVDNGR YTYLDNEYRK YLKSSYAHNT LVLDNKEFLA IKDSWEYIGK YPLISPIYKI 
EDKGVTCIKM NVFDIETNSY IERKFILCED NVIIINRIYS KGKHNLKMYY HFHPRLEIDG 
EKERLLLNKE IYFNIGEYIM GEGIYSSRYN EKEKSKFVKL EYDFNDNIQI IHKILNKNIQ 
FEEICCENSI YSCKIISGNK EYMIFCKNED SIEKQNVLYI QNNLLYKNFK VVVK