Gene SNSL254_A1726 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1726
Symbol
ID	6486417
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1698151
End bp	1699269
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	56%
IMG OID	642737106
Product	sgc region protein SgcX
Protein accession	YP_002040858
Protein GI	194443032
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.955403
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTTTT CTGTGCAGGA AACGCTTTTT TCTTTACTGC GGCTAAACGG GATTTCAGGA 
CATGAAAGCA GTATTGCAAA CGTTATGCAG CACGCGTTTG AACAGCAGGC CAAAGACGTC 
TGGCGGGATC GCTTAGGCAA TGTCGTCGCC CGTTATGGCA GCGACAAATC CGACGCGCTT 
CGCCTGATGA TTTTTGCGCA TATGGATGAA GTCGGTTTTA TGGTACGCAA GATCGAACCC 
TCCGGCTTTT TACGTTTTGA ACGCGTGGGC GGCCCGGCGC AAATTACTAT GCCCGGTTCG 
GTCGTGACGC TTGCCGGACG TTCAGGCGAT ATCATGGGCT GTATCGGTAT TAAAGCATAT 
CACTTCGCGA AGGGTGACGA GCGCACCCAG CCTCCCGCGC TCGATAAACT CTGGATTGAT 
ATCGGCGCAA AAGATAAAGC GGATGCCGAA CGAATGGGTA TTCAGGTGGG GACGCCAGTA 
ACCCTTTACA ACCCGCCGCA CTGTCTGGGC AACGACCTGG TATGCAGTAA GGCGCTGGAT 
GACAGACTGG GGTGTACGGC GCTACTGGGC GTCGCCGAGG CTCTCGCCTC CACACCGCTC 
GATATCGCGG TGTTCCTGGT CGCGTCGGTA CAGGAAGAGT TCAATATTCG CGGGATTGTT 
CCCGTTTTAC GACGCGTGCG CCCCGACCTG GCGATTGGTA TTGATATCAC CCCCTCCTGC 
GACACGCCTG ACCTGCAGGA TTACTCAGAT GTGCGGGTCA ACCACGGCGT CGGCATCACC 
TGTCTGAACT ATCACGGACG CGGTACGTTG GCGGGACTGA TTACGCCGCC GCGTTTGCTG 
CGGATGCTGG AGACCACCGC GCACGAAAAT AATATTCCCG TACAGCGAGA AGTCGCGCCA 
GGCGTCATCA CCGAAACCGG CTACATTCAG GTTGAACTGG ACGGTATTCC CTGCGCCAGT 
CTTTCTATTC CCTGCCGCTA TACCCACTCG CCAGCCGAAG TCGCCAGCCT GCGCGACCTG 
GCTGATTGTA TCCGTTTACT GACTGCGCTG GCCAATATGT CGCCAGAACA GTTTCCCATT 
GAGCCTGAAA CAGGCGCTAC ACAAGAGGCA CGACCATGA

Protein sequence

MTFSVQETLF SLLRLNGISG HESSIANVMQ HAFEQQAKDV WRDRLGNVVA RYGSDKSDAL 
RLMIFAHMDE VGFMVRKIEP SGFLRFERVG GPAQITMPGS VVTLAGRSGD IMGCIGIKAY 
HFAKGDERTQ PPALDKLWID IGAKDKADAE RMGIQVGTPV TLYNPPHCLG NDLVCSKALD 
DRLGCTALLG VAEALASTPL DIAVFLVASV QEEFNIRGIV PVLRRVRPDL AIGIDITPSC 
DTPDLQDYSD VRVNHGVGIT CLNYHGRGTL AGLITPPRLL RMLETTAHEN NIPVQREVAP 
GVITETGYIQ VELDGIPCAS LSIPCRYTHS PAEVASLRDL ADCIRLLTAL ANMSPEQFPI 
EPETGATQEA RP