Gene Slin_4123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4123
Symbol
ID	8727882
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	4970894
End bp	4972009
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	39%
IMG OID
Product	hypothetical protein
Protein accession	YP_003388909
Protein GI	284038979
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00000681641
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0000116625
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAAAGCCC TTAACTTGCA ACAATCCAGA AGACATAGTG CAGCAGGGCA AAGGCCAGCT 
AGTCATCCTG CCGTAGGGAG CTCGCTAGGA ATAAATAATG ACGAAAGTGA TCTATTAGAG 
GATATACTAA CGGGCATTAA ATCAGTACCA GCGAAACTCG GGTCATTAAC TGCCGAGGTA 
ACTGGGGTAG GAGATGTATA TAACTCGGCC AAACGATTAA GAGATCCGAA TAGTGATAAG 
GTCGTAAATG CATTAAAAGT GACGTCAGGG CTGGGTACTA TGGCAACCCG TAGCACTCAG 
TTTGTGAGTG TGGCAGTACA AGCAGCCAGT GTTGCCAGTA ATGTTATTCC TGGCTTAAAC 
ATTGCCACCG CAGGCGTTGA AATGATTGGC TCAGGCTATA CGCTTTATAG AGAGCTGAAC 
AAAAAAGATG GAGCCAAAAC AGCTAAGATT ATCGCAGGAG CCAAAATGGT GGGTAGTGCC 
CTTACAATTG CGGCAGGTGG TCTCGCTATT GCAGGCTTAG CGATGACGCC TGTCGGATGG 
GGCCTTTTAG CTGGATCACT CGCCATTGGC GTTGGCGTGC TTGCTTATAA AGCTTACAAG 
AAAGGTAAAT ACAACAAATG GCTGGAAGAA TATACAAAAT TTGTAGCGCA AAGAAATAAC 
CTAAAAGTTG TCAGTGAAGA CATCATAAAA GAAAGCCAAA TTCTAAAAAA TATTTACTCA 
AATAGCTTTT CTTCGAATAG ATTAGTAAGT CTTAAAGCGT GGAAGGGACT AATAACAATG 
ACAAATAAAT TCGAGAACTA CAGCGAAGAA ATAATAAAGA CCATGAAGGT AACGATGCAG 
AACGGAGATC GCTATAAGAA ATATATGAAA GAGCTAAAAG GGCTTAACAC AGTAAATAAA 
TACAAAAGAT TCATTGACAA TAAGGCGTTA AAAGAATACA ACGATAAGAT GAGTGATCAT 
GAAGATGGCT ATAAAAAAGA TTTGAAAAAA ATTTTAAAAG ATACACTTGA TGCTATTAAG 
CCTTTTATCA CTGTAATGAA TATGGATTTT CCGCTAGAAA GCAAGAAGCT CATCAAACCA 
TATTTAAAAA TAGATGGCTA CAAAAAAGAA TTTTAA

Protein sequence

MKALNLQQSR RHSAAGQRPA SHPAVGSSLG INNDESDLLE DILTGIKSVP AKLGSLTAEV 
TGVGDVYNSA KRLRDPNSDK VVNALKVTSG LGTMATRSTQ FVSVAVQAAS VASNVIPGLN 
IATAGVEMIG SGYTLYRELN KKDGAKTAKI IAGAKMVGSA LTIAAGGLAI AGLAMTPVGW 
GLLAGSLAIG VGVLAYKAYK KGKYNKWLEE YTKFVAQRNN LKVVSEDIIK ESQILKNIYS 
NSFSSNRLVS LKAWKGLITM TNKFENYSEE IIKTMKVTMQ NGDRYKKYMK ELKGLNTVNK 
YKRFIDNKAL KEYNDKMSDH EDGYKKDLKK ILKDTLDAIK PFITVMNMDF PLESKKLIKP 
YLKIDGYKKE F