Gene SeD_A1622 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1622
Symbol
ID	6874134
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1565923
End bp	1567092
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	52%
IMG OID	642784767
Product	tetratricopeptide repeat protein
Protein accession	YP_002215435
Protein GI	198242977
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2956] Predicted N-acetylglucosaminyl transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000649442
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	2.66656e-22
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTTGGAGT TGTTATTTCT GCTGTTGCCT GTAGCCGCTG CCTATGGGTG GTATATGGGT 
CGCAGAAGTG CGCAACAAAC AAAACAGGAT GAAGCTAACC GCCTGTCGCG CGATTATGTC 
GCAGGGGTTA ACTTCCTGCT GAGTAACCAA CAAGATAAAG CGGTGGATCT GTTCCTCGAT 
ATGCTTAAAG AGGATACGGG CACCGTTGAG GCTCATCTCA CTCTCGGTAA TCTGTTTCGC 
TCTCGCGGCG AAGTCGATCG CGCCATTCGT ATTCATCAAA CGCTCATGGA AAGCGCTTCA 
TTGACCTATG AACAGCGTTT ACTGGCTGTT CAGCAACTGG GGCGCGACTA TATGGCCGCC 
GGTTTATATG ACCGCGCGGA AGATATGTTT AACCAACTTA CCGACGAAAC GGAATTTCGC 
GTAGGCGCGT TACAGCAGCT CTTGCAAATC TATCAGCTAA CCAGCGACTG GCAAAAGGCG 
ATCGAAGTAG CAGAACGGCT GGTGAAGCTG GGCAAAGATA AACAACGTAT CGAAATCGCC 
CATTTTTACT GTGAGTTAGC GTTACAGCAG ATGGGCAACG ACGACATGGA TCGCGCGATG 
GCGTTGCTGA AAAAAGGTGC CGCCGCAGAT AAAAATAGCG CCCGGGTGTC TATCATGATG 
GGGCGCGTTT ATATGGCGAG AGGGGATTAC GCCAAAGCGG TCGAAAGCCT GCAACGTGTG 
ATCGTTCAGG ATAAAGAGCT GGTCAGCGAA ACGCTGGAGA TGCTGCAAAC CTGTTATCAA 
CAGCTCGGTA AAAATGCCGA GTGGGCGGAG TTTTTACGTC GCGCCGTTGA GGAGAATACC 
GGTGCTGGCG CTGAGTTAAT GCTTGCCGAT ATTCTGGAAG CGCGTGAAGG TAGTGACGCA 
GCTCAAGTCT ATATCACGCG TCAGCTACAG CGACATCCTA CCATGCGGGT GTTCCATAAG 
CTGATGGATT ACCATCTCAA CGAGGCGGAA GAAGGGCGAG CGAAAGAAAG CCTGATGGTA 
CTGCGTGATA TGGTTGGCGA GCAGGTGCGC AGTAAACCGC GGTATCGTTG TCAGAAATGC 
GGTTTTACCG CCTATACCTT GTACTGGCAC TGTCCGTCCT GCCGGGCATG GTCGACCATT 
AAACCTATTC GCGGACTTGA TGGGCAGTAG

Protein sequence

MLELLFLLLP VAAAYGWYMG RRSAQQTKQD EANRLSRDYV AGVNFLLSNQ QDKAVDLFLD 
MLKEDTGTVE AHLTLGNLFR SRGEVDRAIR IHQTLMESAS LTYEQRLLAV QQLGRDYMAA 
GLYDRAEDMF NQLTDETEFR VGALQQLLQI YQLTSDWQKA IEVAERLVKL GKDKQRIEIA 
HFYCELALQQ MGNDDMDRAM ALLKKGAAAD KNSARVSIMM GRVYMARGDY AKAVESLQRV 
IVQDKELVSE TLEMLQTCYQ QLGKNAEWAE FLRRAVEENT GAGAELMLAD ILEAREGSDA 
AQVYITRQLQ RHPTMRVFHK LMDYHLNEAE EGRAKESLMV LRDMVGEQVR SKPRYRCQKC 
GFTAYTLYWH CPSCRAWSTI KPIRGLDGQ