Gene Slin_4920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4920
Symbol
ID	8728684
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	5990770
End bp	5992290
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	50%
IMG OID
Product	hypothetical protein
Protein accession	YP_003389697
Protein GI	284039767
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.404892
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.563369
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTTT TGTTGGTATG GATTGCGTAT GGGGCTCTTT TTTGCTTTGA TAGCGAGTTA 
GTCTATGGAC AACATGTTAA TCAGTATCAG CTCGAAGTAA GCGGACTGGG TTCGTCCGAT 
CAGACGCCCT TCTGGTTACG AGCCAATCAA TATGGTACGG TTCCGTTAAC AGGCCCGGCT 
CTTCGACTAA ATGCGGGCTT ACATGCTGAT TACCGTCCTG CCGACAGTAC CGGCCATCGT 
CCAAAAGCCG ATTGGGGGTA TGGCGTCAGC GTCGTGGCTA ATGTAGGGTC AACAAGCCAG 
TTTCTCCTTC CCGAAGCCTA CATTAAAGGG CGGGTTGGTG CGTTTGAGCT TTACGTCGGC 
CGTCGCAAAG AAATTATTGG GCTCGTGGAT ACACTGCTGA CGAGTGGGTC CTATATCTGG 
TCGGGTAATG CGCTGCCTTT TCCTAAGATT CAACTGGCTG TACCGGTCTT TACATCCATC 
CCGTTCACCA AAGGAGTGCT TTCTGTCATG GGCACTTTTT CGCACGGGTG GTTCGAGAAT 
GGCGACCGAT TGGTGAAAGA TTCGTATCTC CATCAGTCTT CGGTTTATGG ACGTTTGGGT 
AAACCGTCGT GGCGGGTTCG TTTCTACGGC GGATTCAATC ATCAGGTCAT GTGGGCAGGT 
CATTCCGAAT TTATAGATCC TACCGTGGCA GCCAATGGTA AACTACCCTC AAACATCAAG 
TACTATCCGG CAGTCGTATT AGGTACCCGA AATCCCTTCC CCGACGACCA GGCCATTCAA 
ACGATAAGCC ATTTTGAAGA AAACAGGATT GGCAATCACC TGGGCTCTAT CGACTTTGCA 
GCTGAGGTTA ACCTGAACCA CTGGAACCTG TTTGCCTATC GGCAATTTAT GTACGACGAT 
GGCTCTCTAT TTTATGGTAC GAACCTGGAC GATGGTCTGA ATGGCCTCCG CATCCGAAAC 
CGGGATCAAC TAACCGGGGC TGCTTTTTTT CTGAAGCAGA TTACAGTTGA GTATATGTTT 
ACCGGGAGTC AGGGCGGTGA TTTGTTTATC CTTGACGATC CGCAAAAACG GGGGCGGGAT 
GATTATTTCT CGAATAGCCA GTACCTCGAT GGCTGGACTT ATTTTGGCCG AACAATTGGC 
ACGCCATTTA TTACCCCGCA AAGCGAAGTG CGGTCGTCCT TACCGCCCCG GTTTGGTATT 
GCCAACAACC GGGTGAGCCT TTTCCACGTT GGGGTAAGTG CGTTGGTGTT GAATAAGGTC 
GATATAACGA CACGTTTGTC ATTTAGCCGT AATGCAGGCT CTTATCCCAT TCCTTATTTA 
ACGATACCAG CCCAGTTTTC AGGATTGTTT ACGGCGTCGG TTCCTATCGG TTTATTTGGA 
GGAACCACCC TGAATGGGTC AATCGCGGTC GATTCGGGCG GGTTATTACC CAATAGCGTG 
GGTACTTACG TGGCTTTGCG GAAAACCGGG CTGCTCGGTG GGAGCCGGCG CGCACCCGTT 
CCCATACGTA GCGCCTATTA G

Protein sequence

MKFLLVWIAY GALFCFDSEL VYGQHVNQYQ LEVSGLGSSD QTPFWLRANQ YGTVPLTGPA 
LRLNAGLHAD YRPADSTGHR PKADWGYGVS VVANVGSTSQ FLLPEAYIKG RVGAFELYVG 
RRKEIIGLVD TLLTSGSYIW SGNALPFPKI QLAVPVFTSI PFTKGVLSVM GTFSHGWFEN 
GDRLVKDSYL HQSSVYGRLG KPSWRVRFYG GFNHQVMWAG HSEFIDPTVA ANGKLPSNIK 
YYPAVVLGTR NPFPDDQAIQ TISHFEENRI GNHLGSIDFA AEVNLNHWNL FAYRQFMYDD 
GSLFYGTNLD DGLNGLRIRN RDQLTGAAFF LKQITVEYMF TGSQGGDLFI LDDPQKRGRD 
DYFSNSQYLD GWTYFGRTIG TPFITPQSEV RSSLPPRFGI ANNRVSLFHV GVSALVLNKV 
DITTRLSFSR NAGSYPIPYL TIPAQFSGLF TASVPIGLFG GTTLNGSIAV DSGGLLPNSV 
GTYVALRKTG LLGGSRRAPV PIRSAY