Gene Slin_4226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4226
Symbol
ID	8727985
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	5094081
End bp	5095334
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	52%
IMG OID
Product	hypothetical protein
Protein accession	YP_003389010
Protein GI	284039080
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGG AGCCAATTGG AATTTTATTA CTTTTGCTGC TGGCGACTCC TGTGCTGTTG 
GCGCAGACGC CCACTTATAC GGCCGATATT CAGCCCATTC TGGCTCATCA TTGTGCTCCC 
TGCCATCACC CGGGCGGTTT AGGGCCGTTT AGCCTGCTGA CCTACGAAGA CGTAGCCAAA 
CGAGGTAAAT TTATTGCCAA AGTCACCCAG ATTCGATACA TGCCGCCTTT TCCAGCCGAC 
CGGCAGTTTC AGCATTATGC GAACGAGCGG GGGCTGTCAG AAGCCGAAAT CAATACCATT 
CAGGCCTGGG TGCAGGGGGG GATGGTACAA GGTAAAGAGG TACGGGGAAA GGATAATAGG 
GTGGGGGCGA AAGGAGGTGC GATCCAATCC GAACGCAATG CCCGAACGCC GGACCTTGTG 
CTGCGTATGA AGCCTTACAA TATTAAGGGC GACGTGCAGG AGGACTTTCG GTATTTCCAC 
GTACCCATGG GCTTAACGCA GGACATATGG GTCGAAGCCG TTGAGTTTGT ACCTGGTAAC 
CGTAAGTTAC TCCACCACAG TCGGCTTATG ATCGACTCTA CGGGCACGAT GGCCGGTATT 
GACGGCATAA GTGAAGAGGA CCCCCGACTG CGGGAATTTC AGAAAACACC GCTGGCCGAT 
GAGTTTCTGT ATGGATGGGT GCCGGGTAAT GACCGGGTAA CATTCCCGGA GGGAGCGGCC 
AAGCGAATTC GGGCGGGTAG CGACCTTATT CTTAATATAC ACTATGCTCC GTCGGCAAAG 
GCCGATCAGG ACCAGTCTGA AGTGAGGTTG TATTTTGCCC GAAAACCAGT GGAACGGGTC 
GTGAAAACAC TTACCCTTAC GGAGAATAAT GTGACCAATC AACCCTTTCA ACTGCCTGCC 
AATACAAAGC CGACGTTTTT TATGAACTAC GGCCCGCTAC GCGATACAGT CCGCCTTCTA 
TCCGTTTTAC CCCACATGCA TCGATTGGGG AAATCGGTTC GGGCGTTTGC CATTACCCCC 
GATGGGGATG TGATCAATCT CATAAAGATT GATGCCTGGG ATTATAACTG GCAACTGTCT 
TACTTCTTTC AAACCCCGCT TGTGTTGCCT AAAGGGGCTA CTATCATTGC CGAAGCCAGT 
TACGACAACA CAGACCAAAA CCCCCTCAAT CCAAACCGGC CTGCCCGAAC GGTGGGCTAC 
GGCTGGAACT CGACCGATGA AATGATGAAT CTGGTCTTCT ATTACATAAA GTAG

Protein sequence

MKKEPIGILL LLLLATPVLL AQTPTYTADI QPILAHHCAP CHHPGGLGPF SLLTYEDVAK 
RGKFIAKVTQ IRYMPPFPAD RQFQHYANER GLSEAEINTI QAWVQGGMVQ GKEVRGKDNR 
VGAKGGAIQS ERNARTPDLV LRMKPYNIKG DVQEDFRYFH VPMGLTQDIW VEAVEFVPGN 
RKLLHHSRLM IDSTGTMAGI DGISEEDPRL REFQKTPLAD EFLYGWVPGN DRVTFPEGAA 
KRIRAGSDLI LNIHYAPSAK ADQDQSEVRL YFARKPVERV VKTLTLTENN VTNQPFQLPA 
NTKPTFFMNY GPLRDTVRLL SVLPHMHRLG KSVRAFAITP DGDVINLIKI DAWDYNWQLS 
YFFQTPLVLP KGATIIAEAS YDNTDQNPLN PNRPARTVGY GWNSTDEMMN LVFYYIK