Gene Slin_1839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_1839
Symbol
ID	8725576
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	2221608
End bp	2222858
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	49%
IMG OID
Product	protein of unknown function DUF214
Protein accession	YP_003386683
Protein GI	284036753
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.877105
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.633197
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATATAC GAATCGCTTC TCAAATAGCC CAAACGCACC TGCTGGCTAA GAAACGTCAG 
ACACTTGTCG CTATGCTGGG GGTCACCTTC GGCATTGCAA TGTTCATTAC CATGATTTCG 
TTTATGCAGG GCGTTAACCA GTTTCTGGAA GATTCGGCGC TGGATGCCAG TCCGCATATT 
CGGATGTATA ACGAGGTAAA CACCCAGCGG CCGGGCCTGA TCGAACAGCT CAACCCCGGC 
AAGTTTAACG TCATTTACCA CCAAAAGCCG AAGGATGAGC AGTCGCGTAT CAAAAACGGG 
ATGACCATTG CCGGACGCAT TGAACGGGCA TCGGGTGTGT TGGGCGTTTC GCCCCAGGTG 
GCTACGCAGG CATTTTATAA TAACGGCCCA ATTCAGATTT CCGGGACAAT TTCGGGAGTG 
GATATCGACC GCGAAAACCG GCTCTATAAA CTAACGACCC GGCTTAAATC GGGTAGCCTG 
AACGCGCTGA AAACCAATCC CGACGGCCTA ATCATGGGGG CCGTACTAGC CGACAAGCTC 
AACGTTCGGG TAGGTGATAA AGTGACGGTA ACAACACCCA GAGGAGGCAT CAGAACCCTG 
CGGGTGGTGG GCACATTTGG CTTTGGCATT GGTACAATCG ACAATACCAA GAGCTACGGA 
AATCTCTCTA CAGTTCAGGA AATGCTGCAA CGCGACCCCA GCTACATTAC CGACATTCAT 
ATTAAAATGT TCGACCCCTT ACAGGCAATA CCTTTTGGGA AACAGCTGCG GGCCATTTAT 
TGGTACTATA CCGAAGACTG GGCAACGGCC AACACGGCCA TACTGGCGGG TGAAAAGATC 
CGAAATATGC TGACTTATGT AGTGTCGTTC ACGCTGCTGG TAGTTGCGGG CTTCGGTATT 
TACAACATCA TGAATATGAC CGTTATCAAC AAAATCAAGG ACATCGCCAT TTTGAAAGCC 
ACCGGTTTTG AGGGTCGCGA CATCATCGCT ATTTTTCTCT TTCAAGCTGT TTTCATTGGT 
GTTTCGGGTG GCCTGTTAGG GCTGGGGATC GGTTTCGGGC TCAGTTATCT GCTGTCAATC 
ACCCCATTCG ATGCCGGTGG GTTCATCAGT ATTAAAACAT TCCCGGTCAT TTTCGAGCCA 
AAGTATTATA TAATGGGGCT GTTATTCGGT GTGATAACCA CTGTTCTGGC AGGGTATTTC 
CCTTCCCGAA AAGCCTCTCA AGTTGACCCC GTTTCCATTT TAAGAGGATA A

Protein sequence

MDIRIASQIA QTHLLAKKRQ TLVAMLGVTF GIAMFITMIS FMQGVNQFLE DSALDASPHI 
RMYNEVNTQR PGLIEQLNPG KFNVIYHQKP KDEQSRIKNG MTIAGRIERA SGVLGVSPQV 
ATQAFYNNGP IQISGTISGV DIDRENRLYK LTTRLKSGSL NALKTNPDGL IMGAVLADKL 
NVRVGDKVTV TTPRGGIRTL RVVGTFGFGI GTIDNTKSYG NLSTVQEMLQ RDPSYITDIH 
IKMFDPLQAI PFGKQLRAIY WYYTEDWATA NTAILAGEKI RNMLTYVVSF TLLVVAGFGI 
YNIMNMTVIN KIKDIAILKA TGFEGRDIIA IFLFQAVFIG VSGGLLGLGI GFGLSYLLSI 
TPFDAGGFIS IKTFPVIFEP KYYIMGLLFG VITTVLAGYF PSRKASQVDP VSILRG