Gene Snas_4136 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_4136
Symbol
ID	8885337
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	4423401
End bp	4424600
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	63%
IMG OID
Product	Extracellular ligand-binding receptor
Protein accession	YP_003512880
Protein GI	291301602
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.831108
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTATC GAGCAGGACG AAAGATCGTC ACCGCCGCGT GCGGTCTACT ACTCCTGACT 
TCCCTTGCCT CATGCTCGGT GAACGACAAG AAGTCACCAG GCACAGTCGA CGTTGGACTG 
CTGACACCGC TTTCCGGCGC CCTCAAAGAG GTCGGCGCGG ACGCGAAGGA CGCGTTCGAC 
CGTTACATCG ACGTGAACGA CGGCAAACTC GGCGGACGAA AGATCAACCT GTCCATTCGC 
GACGAGGGCG ACGACCCGAA GACCTCACTG CCATCGGCCA AGAAGCTGAT GCAGGACGAC 
AACGTCGACG TCATCGTGGG CGCCGCCAGC TCCGCGAACT ACATCGCCGT CGCCCCGGAG 
GCCACCAAGG CCGAAGTCCC CCTGCTCGGA TACGGCGGAC AGCCCCCATT GGACGATGCG 
GGCATCGACT TCAAGTGGCT GTGGCAGACC TCCTTCTCCA CCAGCCAGCT CGGGGCGTCG 
ATCGCGCCCT ACATCAAGGA CAAGGTGGAC GGGTCGGTCT ACACGATCGC GCCGGACTAC 
GAGGGTGGAA AAGCCGTGAT GGGCAGCTTC ATCAAGCCCT TCATGGAGGC GGGTGGCAAG 
CTCGCCAACG CCGAGAAGGA ACCGGCGTGG ACGCCGTGGC CGAAGACCAT GGACTTCTCC 
AAGTACTTCG AGGAGGCCGC GGCCAGCGAC GCCAAGGCGA TCTTCGCCTA CTACGGCGGC 
GCCCCGGCCA TCGAGTTCGT CAAGCAGTAC GCCAAGTCCC CCGCCAAGGA CATCCCGCTG 
TACGGCGCGT TCCTCACCGA AGGCGCGGTA CTGGAAGCGC AAGGCGAAGC CGCCGAGGGC 
GTCCAGACCG TCATGAACTA CGCGCCCGAC ATCGACAACG CCGCGAACCG CCGGTTCGTG 
TCCGAATGGA GTGAGATCAA CTCCGACCGC CCCACCAGCC TCTACAGTAT GGTCGGCTGG 
GACGCCGCCC TGGTGCTCGA CCAGGCCATC TCCCGGATCC CTCTTGACGA AGAGGTGACA 
CCGGCGAAGA TCAACAAGGC GATGGGGGAA CTGGGAACGA TCAACAGTTC GCGGGGCTCA 
TGGCAGTTCG ACGAGGAGCT CCACATTCCG ATCCAGCGCT GGTACCTGCG TACCGTCGCC 
AAGGACGGAC CATCACTGAC CAATGTGGTC ACCGAAGACC TGGACACGAT CGGCGGCTGA

Protein sequence

MKYRAGRKIV TAACGLLLLT SLASCSVNDK KSPGTVDVGL LTPLSGALKE VGADAKDAFD 
RYIDVNDGKL GGRKINLSIR DEGDDPKTSL PSAKKLMQDD NVDVIVGAAS SANYIAVAPE 
ATKAEVPLLG YGGQPPLDDA GIDFKWLWQT SFSTSQLGAS IAPYIKDKVD GSVYTIAPDY 
EGGKAVMGSF IKPFMEAGGK LANAEKEPAW TPWPKTMDFS KYFEEAAASD AKAIFAYYGG 
APAIEFVKQY AKSPAKDIPL YGAFLTEGAV LEAQGEAAEG VQTVMNYAPD IDNAANRRFV 
SEWSEINSDR PTSLYSMVGW DAALVLDQAI SRIPLDEEVT PAKINKAMGE LGTINSSRGS 
WQFDEELHIP IQRWYLRTVA KDGPSLTNVV TEDLDTIGG