Gene SeD_A1123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1123
Symbol
ID	6874481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1115675
End bp	1117384
Gene Length	1710 bp
Protein Length	569 aa
Translation table	11
GC content	49%
IMG OID	642784308
Product	side tail fiber protein
Protein accession	YP_002214982
Protein GI	198244544
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTATTG GATTCGGAAA TAATGTCGTC TCCTCACTGG CGGCTGATAT TACCGCCAGC 
CAGACGACCA TTCAGGTGAT GCCTGGTGTG GGAGCGATGT TTGCTAATTT GCTGACCAGC 
GATTATGCAA ACAGCTCAAA CCCTCTTAAA ACTTACGCCA AAATTACACT GACAGACGCA 
AAAGAAACAG TTTTTGAGGT ATGCCATCTG ACAGCAGTTA ATAATGACAT GCTGACGGTT 
ATTCGCGGTC AGGAAGGTAC AACAGCGAAG GGATGGTCAC TGAATGACGT TATAGCGAAT 
TTTGCGACGC GAGGATCTGA AAATCAGTTT GTACAAATTG AAGAGCTCCA GAGTGGGCAT 
TATGTCGCTG GTGTGGCCGG AGGTACAGAA AATAATCTGA CGCTGGAGTT ACCAGCAACT 
TATTTCGTCA ATGGTGGAGT TGACTGGACA TTGCGCACTC CACTTGTGGT TATTCCGGCG 
CTAAACAATA CCGGAGCCAG CACTCTGCAA CTGACGATGG GAGGACGTGT GCTTGGCATA 
TTCCCACTAT ACAAGGGGAA TAAAGCAGAG TTATCGGCCA ATGATATTAT TAAAGATATT 
CCTGTCTTAT GCGTTCTGGA TAATACAAAA ACCTATTTTT CTGTGCTTAA TCCCCTGGAG 
ATTTATTTGG GATCACGGTA TTTGCAGAAG GACCAGAACC TGTCCGACGT ACCGGATAAG 
GCCAAAGGTC GCTCCAGTCT TGAGGTCTAC AGCAAAACCG AAAGTGATGA AAACTACATG 
GCTAAAAGCC AGTGTGGTGC GGATATCCCG AATAAGCCGC TGTTTGTACA AAATATCGGA 
GCGCTCCCTG CATCAGGTAC GGCTGTTGCA GCGAACAGAC TGGCATCACG CGGCGCGCTT 
CCGGCACTGA CTGGTGCGAC AAGAGGCAGC GATAGCGGCC TGATAATGGG CGAGGTCTAC 
AACAATGGCT ATCCGACGCA ATACGGAAAT ATTTTACGTC TGACCGGAAC CGGTGATGGG 
GAAATCCTCA TTGGCTGGAG CGGGACAAAC GGTGCGCCAG CGCCCGCATA TATTCGCAGT 
CATCGAGATA CCGCCGATGC TGAGTGGTCC GAATGGGCGA TGCTCTACAC CTCACTAAAT 
CCGCCACCGA ATTCGTATCC AGTAGGTGCG GCGATAGCAT GGCCGTCTGA TGCTACCCCA 
GCCGGTTACG CCCTGATGCA GGGGCAATCG TTTGATAAAT CTGCTTACCC GTTACTGGCT 
ATAGCGTATC CGTCCGGCAT TATCCCTGAC ATGCGGGGCT GGACAATAAA GGGTAAGCCC 
ATCAGTGGAC GTGCTGTACT GTCGCAAGAA ATGGACGGCA ACAAATCGCA CAGTCACAGC 
GCCAGAGCGC AGGATACTGA CTTAGGGACA AAATCTACCT CATCCTTTGA TTACGGCACG 
AAATCGACCA ATACCACGGG CAATCATACT CACCAGTTCG GCGGTTATAT CAATTCATAC 
TGGGGAGATT CCAATCACAC CTCATTTCAG CCAGGAGGTG GTGCATGGAC ACAGGCCGCT 
GGCGACCATG CACATACAGT TTATATCGGA GGACATGAGC ACACCATGTA TATAGGTCCA 
CACGGACACG TCGTTATTGT GGACGCAGAC GGTAATGCGG AAACCACGGT TAAAAACATT 
GCATTTAACT ACATAGTGAG GCTGGCATAA

Protein sequence

MIIGFGNNVV SSLAADITAS QTTIQVMPGV GAMFANLLTS DYANSSNPLK TYAKITLTDA 
KETVFEVCHL TAVNNDMLTV IRGQEGTTAK GWSLNDVIAN FATRGSENQF VQIEELQSGH 
YVAGVAGGTE NNLTLELPAT YFVNGGVDWT LRTPLVVIPA LNNTGASTLQ LTMGGRVLGI 
FPLYKGNKAE LSANDIIKDI PVLCVLDNTK TYFSVLNPLE IYLGSRYLQK DQNLSDVPDK 
AKGRSSLEVY SKTESDENYM AKSQCGADIP NKPLFVQNIG ALPASGTAVA ANRLASRGAL 
PALTGATRGS DSGLIMGEVY NNGYPTQYGN ILRLTGTGDG EILIGWSGTN GAPAPAYIRS 
HRDTADAEWS EWAMLYTSLN PPPNSYPVGA AIAWPSDATP AGYALMQGQS FDKSAYPLLA 
IAYPSGIIPD MRGWTIKGKP ISGRAVLSQE MDGNKSHSHS ARAQDTDLGT KSTSSFDYGT 
KSTNTTGNHT HQFGGYINSY WGDSNHTSFQ PGGGAWTQAA GDHAHTVYIG GHEHTMYIGP 
HGHVVIVDAD GNAETTVKNI AFNYIVRLA