Gene Slin_6339 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_6339
Symbol
ID	8730123
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	7690122
End bp	7691342
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	55%
IMG OID
Product	FG-GAP repeat protein
Protein accession	YP_003391097
Protein GI	284041167
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAACTG CCTATGGACA GGAAAAGAAA ACCCTCTTTG ATGTCCGCCA GAAGCAGGCC 
GAAACCGCTA CCAGAGCTGC CAACTCAGCG ACCCCGGTTG TTCCAGCGGG TGATTTTAAA 
AAGACCACCC TCACCCGCGA TTTTATTTCG GAAGGGGTAG CCGTGGCCGA TCTGAATAAA 
GACGGACGCA TGGACATTGT AGCCGGATAC TACTGGTTTG AAGCCCCCAA CTGGACGCGC 
CACGAGATGG CTTCGTCCCG CACCTTCGAC CCCCGGAAGG AATACAGCGA GTCGTTCCTG 
AACCTAGGCA TGGATGTAAA TCTGGATGGT TGGGACGATG TCGTGATTAT TGATTTTCCC 
GGAAAACCCG CGTTCTGGTT CGAAAACCCG AAGCATAAAA CGGGTGCAGC CACCTCGGGC 
GAGTGGAAAA AGCACATCAT TGCCGACTCA ATAGGCATCG CCAACGAGTC GCCGGGCTTT 
ATTGATATAG ACGGCGACGG ACGCCTGGAT ATTTTGTGTG GCGATAAAGC AAAAAAGCAG 
ATCGTCTGGT TGAAACCCCC GTCCAAACCC GGCGAAACGG AATGGGAACG GTATCCGCTG 
AGCAAGGAGA ATGTACCGGG GACGGAAATC TTCTCCCACG GCATCGGCTA CGGCGATGTG 
GATAAAGACG GTATTAAAGA CGTTGTGATT CGGGATGGCT GGTTTAAAGG AACAACCGAT 
AATAAATCCG GCAACTGGGT GTTTCACCCC GCTGATTTGG GTGAACCCTG CTCACACATG 
CAGGTGTTGG ACGTGAACGG CGATGGTAAA AATGATGTCG TCAGCGCATC GGCGCACGCG 
CTGGGCATCT GGTGGCATGA GCAGGTGATG GATGAACAGG GGAAAATTAA TTTCAAAACC 
CACCTCATGA GCAACACCAC CGCCCAAACC CACTCGTCCA TCATGGCCGA CCTGAACGGC 
GACGGTCGCG CCGACTACAT CACGGGCAAA CGCTTTCTGG CCCACCACGG CCGCGACCCC 
GGCGACAGTG ACCCCGGCAT CCTGCTCTGG TTTGAGTTCA CGCCCGGCAA GGCACCCTAC 
TACAAAGAGC ACATCATCGA CAACGATTCC GGTGCGGGCC TCAACATCGT AGCGCAGGAC 
ATGAACGGCG ACAAAAAGCC CGACATCGTC ATCGCCAACA AGAACGGCGT GTTCCTGTTT 
GAGAACAAGG TGAGGAAGTA G

Protein sequence

MATAYGQEKK TLFDVRQKQA ETATRAANSA TPVVPAGDFK KTTLTRDFIS EGVAVADLNK 
DGRMDIVAGY YWFEAPNWTR HEMASSRTFD PRKEYSESFL NLGMDVNLDG WDDVVIIDFP 
GKPAFWFENP KHKTGAATSG EWKKHIIADS IGIANESPGF IDIDGDGRLD ILCGDKAKKQ 
IVWLKPPSKP GETEWERYPL SKENVPGTEI FSHGIGYGDV DKDGIKDVVI RDGWFKGTTD 
NKSGNWVFHP ADLGEPCSHM QVLDVNGDGK NDVVSASAHA LGIWWHEQVM DEQGKINFKT 
HLMSNTTAQT HSSIMADLNG DGRADYITGK RFLAHHGRDP GDSDPGILLW FEFTPGKAPY 
YKEHIIDNDS GAGLNIVAQD MNGDKKPDIV IANKNGVFLF ENKVRK