Gene SeSA_A1729 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A1729
Symbol
ID	6518227
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	1672518
End bp	1673636
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	56%
IMG OID	642746833
Product	putative sgc region protein SgcX
Protein accession	YP_002114636
Protein GI	194734384
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTTTT CTGTGCAGGA AACGCTTTTT TCTTTACTGC GGCTAAACGG GATTTCAGGA 
CATGAAAGCA GTATTGCAAA CGTTATGCAG CACGCGTTTG AACAGCAGGC CAAAGACGTC 
TGGCGGGATC GCCTGGGCAA TGTCGTCGCC CGTTATGGCA GCGATAAATC CGACGCGCTT 
CGCCTGATGA TTTTTGCGCA TATGGATGAA GTGGGTTTTA TGGTACGCAA GATCGAACCC 
TCCGGTTTTT TACGTTTTGA ACGCGTGGGC GGCCCGGCGC AAATTACTAT GCCCGGTTCG 
ATTGTGACGC TTGCCGGACG TTCAGGCGAT ATCATGGGCT GTATCGGTAT TAAAGCATAT 
CACTTCGCGA AGGGTGACGA GCGCACCCAG CCTCCCGCTC TCGATAAACT CTGGATTGAT 
ATCGGCGCAA AAGATAAAGC GGATGCCGAA CGAATGGGTA TTCAGGTGGG GACGCCAGTA 
ACCCTTTACA ACCCGCCGCA CTGTCTGGGC AACGACCTGG TATGCAGTAA GGCGCTGGAT 
GACAGGCTGG GGTGTACGGC GCTACTGGGC GTCGCCGAGG CCCTCGCCTC CACACCGCTC 
GATATCGCGG TATTCCTGGT CGCGTCGGTG CAGGAAGAGT TCAATATTCG CGGCATTATT 
CCCGTTTTAC GACGCGTGCG CCCCGACCTG GCGATTGGTA TTGATATCAC CCCATCCTGC 
GACACGCCTG ACCTGCAGGA TTACTCGGAT GTGCGGGTCA ACCACGGCGT CGGCATCACC 
TGTCTGAACT ATCACGGACG CGGTACGTTG GCGGGACTGA TTACGCCGCC GCGTTTGCTG 
CGGATGCTGG AGACCACCGC GCACGAAAAT AATATTCCCG TACAGCGAGA AGTCGCGCCA 
GGCGTCATCA CCGAAACCGG CTACATTCAG GTTGAACTGG ACGGTATTCC CTGCGCCAGC 
CTTTCTATTC CTTGCCGCTA TACCCACTCG CCAGCCGAAG TCGCCAGCCT GCGCGACCTG 
ACTGATTGTA TCCGTTTACT GACTGCGCTG GCCAATATGT CGCCAGAACA GTTTCCCATT 
GAGCCTGAAA CAGGCGCTAC ACAAGAGGCA CGACCATGA

Protein sequence

MTFSVQETLF SLLRLNGISG HESSIANVMQ HAFEQQAKDV WRDRLGNVVA RYGSDKSDAL 
RLMIFAHMDE VGFMVRKIEP SGFLRFERVG GPAQITMPGS IVTLAGRSGD IMGCIGIKAY 
HFAKGDERTQ PPALDKLWID IGAKDKADAE RMGIQVGTPV TLYNPPHCLG NDLVCSKALD 
DRLGCTALLG VAEALASTPL DIAVFLVASV QEEFNIRGII PVLRRVRPDL AIGIDITPSC 
DTPDLQDYSD VRVNHGVGIT CLNYHGRGTL AGLITPPRLL RMLETTAHEN NIPVQREVAP 
GVITETGYIQ VELDGIPCAS LSIPCRYTHS PAEVASLRDL TDCIRLLTAL ANMSPEQFPI 
EPETGATQEA RP