Gene SeSA_A1837 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A1837
Symbol
ID	6517377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	1778901
End bp	1780070
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	51%
IMG OID	642746934
Product	tetratricopeptide repeat protein
Protein accession	YP_002114737
Protein GI	194737248
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2956] Predicted N-acetylglucosaminyl transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000022719
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000343343
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTGGAGT TGTTATTTCT GCTGTTGCCT GTAGCCGCTG CCTATGGGTG GTATATGGGT 
CGCAGAAGTG CGCAACAAAC AAAACAGGAT GAAGCTAACC GCCTGTCGCG CGATTATGTC 
GCAGGGGTTA ACTTCCTGCT GAGTAACCAA CAAGATAAAG CGGTGGATCT GTTCCTCGAT 
ATGCTTAAAG AGGATACCGG CACCGTTGAG GCTCATCTCA CTCTCGGTAA TCTGTTTCGC 
TCACGAGGCG AAGTCGATCG CGCCATTCGT ATTCATCAAA CGCTCATGGA AAGCGCTTCA 
TTGACCTATG AACAGCGTTT ACTGGCTGTT CAGCAACTGG GGCGCGACTA TATGGCCGCC 
GGTTTATATG ACCGCGCGGA AGATATGTTT AACCAACTTA CCGACGAAAC GGAATTTCGC 
GTAGGCGCGT TACAGCAGCT CTTGCAAATC TATCAGCTAA CCAGCGACTG GCAAAAGGCG 
ATCGAAGTAG CAGAACGGCT GGTGAAACTG GGCAAAGATA AACAGCGTAT CGAAATCGCC 
CATTTTTACT GTGAGTTAGC GTTACAGCAG ATGGGCAACG ACGATATGGA TCGCGCGATG 
GCGTTGCTGA AAAAAGGTGC CGCCGCAGAT AAAAATAGCG CCCGGGTGTC TATCATGATG 
GGTCGCGTTT ATATGGCGAG AGGGGATTAC GCCAAAGCGG TCGAAAGCCT GCAACGTGTG 
ATCGTTCAGG ATAAAGAGCT GGTCAGCGAA ACGCTGGAGA TGCTGCAAAC CTGTTATCAA 
CAGCTCGGTA AAAATGCCGA GTGGGCGGAG TTTTTACGTC GCGCCGTTGA GGAGAATACC 
GGTGCTGGCG CTGAGTTAAT GCTTGCCGAT ATTCTGGAAG CGCGTGAAGG TAGTGACGCA 
GCTCAAGTCT ATATCACGCG TCAGCTACAG CGACATCCTA CCATGCGGGT GTTCCATAAG 
CTGATGGATT ACCATCTCAA TGAGGCGGAA GAAGGGCGAG CGAAAGAAAG CCTGATGGTA 
CTGCGTGATA TGGTTGGCGA GCAGGTGCGC AGTAAACCGC GGTATCGTTG TCAGAAATGC 
GGTTTTACCG CCTATACCTT GTACTGGCAC TGTCCGTCCT GCCGGGCATG GTCGACCATT 
AAACCTATTC GCGGACTTGA TGGGCAGTAG

Protein sequence

MLELLFLLLP VAAAYGWYMG RRSAQQTKQD EANRLSRDYV AGVNFLLSNQ QDKAVDLFLD 
MLKEDTGTVE AHLTLGNLFR SRGEVDRAIR IHQTLMESAS LTYEQRLLAV QQLGRDYMAA 
GLYDRAEDMF NQLTDETEFR VGALQQLLQI YQLTSDWQKA IEVAERLVKL GKDKQRIEIA 
HFYCELALQQ MGNDDMDRAM ALLKKGAAAD KNSARVSIMM GRVYMARGDY AKAVESLQRV 
IVQDKELVSE TLEMLQTCYQ QLGKNAEWAE FLRRAVEENT GAGAELMLAD ILEAREGSDA 
AQVYITRQLQ RHPTMRVFHK LMDYHLNEAE EGRAKESLMV LRDMVGEQVR SKPRYRCQKC 
GFTAYTLYWH CPSCRAWSTI KPIRGLDGQ