Gene Slin_4601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4601
Symbol
ID	8728365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	5583326
End bp	5584516
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	57%
IMG OID
Product	formaldehyde dehydrogenase, glutathione- independent
Protein accession	YP_003389378
Protein GI	284039448
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGTCAAA ATCATGGTGT TGCGTATATC AAACCCGGCG TGGTTGAAGT CCAATCCATT 
GACTACCCGA AGCTGGCCCT TGGCGACCGA AAATGTCACC ATGGGGTTAT TCTGCAAATC 
GTTTCGACCA ACATCTGCGG CAGCGACCAG CACATGGTTC GGGGGCGGAC AACGGCACCT 
GCCGGTCTGG TGCTGGGACA CGAAATAACG GGCCTGGTTA TCGAAGCCGG TCGCGATGTG 
GAGTTTATCA AAGAAGGCGA CCTGGTCTCG GTTCCGTTCA ATATTGCCTG CGGGCGTTGC 
CGCAATTGCA AAGTGGGTCA AACGGGCATA TGCCTGAATG TGAACCCCGC CCGCCCTGGT 
GCGGCTTACG GATACGTCGA CATGGGCGGC TGGGTTGGCG GACAGGCCGA ATACGTGATG 
GTGCCCTACG CCGATTTTAA CTTGCTGAAG TTTCCGGATA AAGATCAGGC AATGGCCAAA 
ATTCGCGATC TGACACTCCT CTCCGACATT TTCCCAACGG GCTATCATGG GGCCGTTATG 
GCCGGTGTGG GACCGGGGTC GATTGTGTAC GTTGCGGGTG CCGGACCCGT TGGCCTGGCC 
TGTGCCGCTT CCTGTCATTT GCTCGGAGCC GCCGTCGTTA TTGTTGGCGA CATGATTCCC 
GAGCGGCTGG AGCAAGCCAA AAGCTTCGGT TGTGAAACGA TCGACCTCCG CAACGAAGCC 
TCGCTGGCCG ACCAGATTGC CGCGATCATC GGCGTGCCCG AAGTGGATTC AGCTGTCGAC 
TGCGTAGGTT TTGAAGCACG CGGCCACGGC GCCGATGCCG CCACGGAGCA ACCAGCCACC 
GTGCTGAATG CCGCCATGAC CATTACCCGG GCGGGCGGGG CCATCGGTAT CCCCGGCCTC 
TACGTAACGG GCGACCCCGG GGCCTCGACA GAAGCCGCCA AAGAAGGTAA TCTTAACATT 
CGTATTGGAC TGGGCTGGGC AAAATCACAC TCGTTCTACA CGGGCCAGTG TCCGGTTATG 
AAATACCACC GGCAGTTGAT GAATGCCATT CTGTACGATA AGATACAGAT TGCCAAAGCC 
GTCAATGTGG AAGTGATCAG TTTGGACAAA GCCCCTAAAG GCTACCAGGA TTTCGACAAA 
GGGGCCGCCA AGAAATTCGT GATCGATCCC CACGGAATGA TTCCCAATTA A

Protein sequence

MCQNHGVAYI KPGVVEVQSI DYPKLALGDR KCHHGVILQI VSTNICGSDQ HMVRGRTTAP 
AGLVLGHEIT GLVIEAGRDV EFIKEGDLVS VPFNIACGRC RNCKVGQTGI CLNVNPARPG 
AAYGYVDMGG WVGGQAEYVM VPYADFNLLK FPDKDQAMAK IRDLTLLSDI FPTGYHGAVM 
AGVGPGSIVY VAGAGPVGLA CAASCHLLGA AVVIVGDMIP ERLEQAKSFG CETIDLRNEA 
SLADQIAAII GVPEVDSAVD CVGFEARGHG ADAATEQPAT VLNAAMTITR AGGAIGIPGL 
YVTGDPGAST EAAKEGNLNI RIGLGWAKSH SFYTGQCPVM KYHRQLMNAI LYDKIQIAKA 
VNVEVISLDK APKGYQDFDK GAAKKFVIDP HGMIPN