Gene SeHA_C1895 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C1895
Symbol
ID	6490579
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	1849326
End bp	1850495
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	52%
IMG OID	642742107
Product	tetratricopeptide repeat protein
Protein accession	YP_002045752
Protein GI	194451266
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2956] Predicted N-acetylglucosaminyl transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000228715
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	4.98218e-17
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTGGAGT TGTTATTTCT GCTGTTGCCT GTAGCCGCTG CCTATGGGTG GTATATGGGT 
CGCAGAAGTG CGCAACAAAC AAAACAGGAT GAAGCTAACC GCCTGTCGCG CGATTATGTC 
GCAGGGGTTA ACTTCCTGCT GAGTAACCAA CAAGATAAAG CGGTGGATCT GTTCCTCGAT 
ATGCTTAAAG AGGATACCGG CACCGTTGAG GCTCATCTCA CTCTCGGTAA TCTGTTTCGC 
TCTCGCGGCG AAGTCGATCG CGCCATTCGT ATTCATCAAA CGCTCATGGA AAGCGCTTCA 
TTGACCTATG AACAGCGTTT ACTGGCTGTT CAGCAACTGG GGCGCGACTA TATGGCCGCC 
GGTTTATATG ACCGCGCGGA AGATATGTTT AACCAACTTA CCGACGAAAC GGAATTTCGC 
GTAGGCGCGT TACAGCAGCT CTTGCAAATC TATCAGCTAA CCAGCGACTG GCAAAAGGCG 
ATCGAAGTAG CAGAACGGCT GGTGAAACTG GGCAAAGATA AACAGCGTAT CGAAATCGCC 
CACTTTTACT GTGAGTTAGC GTTACAGCAG ATGGGCAACG ACGACATGGA TCGCGCGATG 
GCGGTGCTGA AAAAAGGTGC CGCCGCAGAT AAAAATAGCG CCCGGGTGTC TATCATGATG 
GGGCGCGTTT ATATGGCGAG AGGGGATTAC GCCAAAGCGG TCGAAAGCCT GCAACGTGTG 
ATCGTTCAGG ATAAAGAGCT GGTCAGCGAA ACGCTGGAGA TGCTGCAAAC CTGTTATCAA 
CAGCTCGGTA AAAATGCCGA GTGGGCGGAG TTTTTACGTC GCGCCGTTGA GGAGAATACC 
GGTGCTGGCG CTGAGTTAAT GCTTGCCGAT ATTCTGGAAG CGCGTGAAGG TAGTGACGCA 
GCTCAAGTCT ATATTACGCG TCAGCTACAG CGACATCCTA CCATGCGGGT GTTCCATAAG 
CTGATGGATT ACCACCTCAA CGAGGCGGAA GAAGGGCGAG CGAAAGAAAG CCTGATGGTA 
CTGCGTGATA TGGTTGGCGA GCAGGTGCGC AGTAAACCGC GGTATCGTTG TCAGAAATGC 
GGTTTTACCG CCTATACCTT GTACTGGCAC TGTCCGTCCT GCCGGGCATG GTCGACCATT 
AAACCTATTC GCGGACTTGA TGGGCAGTAG

Protein sequence

MLELLFLLLP VAAAYGWYMG RRSAQQTKQD EANRLSRDYV AGVNFLLSNQ QDKAVDLFLD 
MLKEDTGTVE AHLTLGNLFR SRGEVDRAIR IHQTLMESAS LTYEQRLLAV QQLGRDYMAA 
GLYDRAEDMF NQLTDETEFR VGALQQLLQI YQLTSDWQKA IEVAERLVKL GKDKQRIEIA 
HFYCELALQQ MGNDDMDRAM AVLKKGAAAD KNSARVSIMM GRVYMARGDY AKAVESLQRV 
IVQDKELVSE TLEMLQTCYQ QLGKNAEWAE FLRRAVEENT GAGAELMLAD ILEAREGSDA 
AQVYITRQLQ RHPTMRVFHK LMDYHLNEAE EGRAKESLMV LRDMVGEQVR SKPRYRCQKC 
GFTAYTLYWH CPSCRAWSTI KPIRGLDGQ