Gene Snas_4144 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_4144
Symbol
ID	8885345
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	4434185
End bp	4435768
Gene Length	1584 bp
Protein Length	527 aa
Translation table	11
GC content	62%
IMG OID
Product	extracellular solute-binding protein family 5
Protein accession	YP_003512888
Protein GI	291301610
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.482132
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00782841
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGCGCAA AACCCCTTAT AGCGCTCGCA GCTGCCGCGG TGCTTACCGC GTCCCTCGCC 
GCCTGTGGCG GCGGTGGCGG CGAAAGCGCC AGCGGCGACA TGAAGTTCGG ACTCGGCGCT 
GAGCCGCCGA GCCTGATTCC GCCGAACACC ACCGAGTCCG AGGGTTCGAT CATCCTCAGC 
CTGACGTACG CGGGGCTGTT CGACTACAAC GAGAAGGCCG AAGCCGAGAA CCTGCTGGCC 
AAGTCGATCG AAACCAAGGA CAACAAGACC TGGACGATCG AGATCGAGGA CGGCCACAAG 
TTCCACAACG GCGAGCCCGT TGACGCGGAA GCGTTCAAGC GCGCCTGGGA CTGGGGCGCC 
TACGCCCCCA ACGCCGCCAC CGGCAGCTAC TTCTTCGACC GCATCAAGGG CTTCGCCGAC 
ATGCAGGGCA AGAAGCCCAA GGCCAAGGAG CTCGCGGGCC TCAAGGCCGA CGGCCAGACC 
CTGACCATCG AGCTGGACAA GCCGTGGGCC GGTTTCTCCA CCATGCTGGG CTACACCGCC 
TTCCTGCCGA TGGCCGAGGA GTGTGTCAAG GACACCAAGG CCTGCAACGA CAAGCCCATC 
GGCAACGGCC CGATGAAGTT CGATGGCAAG TGGAAGCACA AGGAATCCAT CTCGCTGGTC 
AAGAACGACA AGTACAAGGG CCCGAACAAG GTCAAGTACG ACAAGGCCGA CTTCACCATC 
TACGACGGTG ACGCGAACTG CTGGGCCGAC TTCGAGTCCG AGGACATCGA CATCTGCTCC 
CCGCCGGTCG AGAAGTGGGA AGGTGCCAAG AACGACCCGG ACCTGAAGGA ACGCCTGATC 
TCCGAGCCGA GCACCTCGCT CACTTACCTG GGTATGCCGG TCTACGACAA GGCCTTCCAG 
GACAAGAAGC TCCGTCAGGC CTTCAGCCTG GCGATCGACC GCGAGAAGGT CATCGACATC 
GCCACCCCCG GCCGCGCGGT TCCGGCGACC GAGTTCGCTC CGCCGTCGCT GCCCGGTGGC 
GTCGAAGGCG CCTGCGAGTT CTGCAAGTTT GACGCCAAGG AAGCCAAGAA GCTCTTCGAG 
GAGTCGAGCT GGCCCAAGGG CAAGAAGATG GAGATCTGGT ACAACGCCGA CCCGACCAAC 
AAGGCGATCT TCGAGGCCGT CGGTAACCAG CTGAAGAAGA ACCTGGGCGT GGAGTTCGAG 
CTCGTCGTGA AGGACTGGGA CCCGTTCCTG GCTGCCACCG ACAAGCACAA GGCCAAGGGT 
CCGTTCCGTA TGGGCTGGCT GCCGGACTAC CCGCTCAACG AGAACTACCT GAAGCCGATC 
TACGGCAACG GCGCGGCGAA CAACCGCTTC GGTTACGAAG GCAAGGACTT CAACAAGAAG 
CTCGCCGAAG CCGACGCCGC CAAGACCCTC GAAGAGGGTA TGGAGATCTA CGCCGAAGCC 
GAGAAGATCC TGGCCGAGGA AATGATCGGT ATCCCGCTCT CCTGGGCGAA GTCGAGCAGC 
TTCTACAGCG AGAACATCGA CCCGAAGAGC GTGAAGTACT TCCCGGTTGG CCAGATCCAG 
TACGACAAGC TGGCTCCCGC CTAA

Protein sequence

MRAKPLIALA AAAVLTASLA ACGGGGGESA SGDMKFGLGA EPPSLIPPNT TESEGSIILS 
LTYAGLFDYN EKAEAENLLA KSIETKDNKT WTIEIEDGHK FHNGEPVDAE AFKRAWDWGA 
YAPNAATGSY FFDRIKGFAD MQGKKPKAKE LAGLKADGQT LTIELDKPWA GFSTMLGYTA 
FLPMAEECVK DTKACNDKPI GNGPMKFDGK WKHKESISLV KNDKYKGPNK VKYDKADFTI 
YDGDANCWAD FESEDIDICS PPVEKWEGAK NDPDLKERLI SEPSTSLTYL GMPVYDKAFQ 
DKKLRQAFSL AIDREKVIDI ATPGRAVPAT EFAPPSLPGG VEGACEFCKF DAKEAKKLFE 
ESSWPKGKKM EIWYNADPTN KAIFEAVGNQ LKKNLGVEFE LVVKDWDPFL AATDKHKAKG 
PFRMGWLPDY PLNENYLKPI YGNGAANNRF GYEGKDFNKK LAEADAAKTL EEGMEIYAEA 
EKILAEEMIG IPLSWAKSSS FYSENIDPKS VKYFPVGQIQ YDKLAPA