Gene SeD_A4100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4100
Symbol
ID	6875069
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	3949261
End bp	3950406
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	41%
IMG OID	642787049
Product	lipopolysaccharide 1,2-N-acetylglucosaminetransferase
Protein accession	YP_002217676
Protein GI	198244660
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.564193
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAAAA AAATCATATT TACTGTTACT CCTATATTTT CAATTCCTCC ACGTGGCGCG 
GCTGCGGTAG AAACCTGGAT TTACCAGGTT GCAAAACGAC TATCAATACC GAATGCTATT 
GCTTGTATAA AGAATGCTGG CTATCCTGAA TATAATAAAA TAAACGATAA CTGTGATATT 
CATTACATCG GGTTTAGTAA AGTTTATAAG CGTCTTTTTC AGAAATGGAC TCGTCTCGAC 
CCACTACCCT ATTCCCAGCG CGTCCTTAAT ATTAGAGATA AAGTGACTAC CCAGGAAGAT 
AGCGTCATTG TTATTCATAA TAGTATGAAA CTGTATCGGC AGATCAGAGA GCGCAATCCG 
AATGCAAAAC TGGTTATGCA CATGCATAAC GCATTTGAAC CAGAACTTCC TGATAAGGAT 
GCAAAAATTA TCGTGCCCAG TCAGTTTCTT AAAGCGTTTT ATGAAGAAAG ATTGCCCGCC 
GCTGCTGTTA GTATTGTGCC TAATGGTTTT TGTGCTGAGA CTTATAAAAG AAACCCACAA 
AATAACCTCC GTCAGCAATT AAATATTGCG GAAGATGCCA CCGTTCTCTT ATATGCCGGG 
AGAATTTCGC CTGATAAAGG CATCCTGTTG CTTTTGCAGG CGTTCAAAAA ATTACGTACC 
TTAAGAAGTA ATATTAAACT TGTCGTTGTT GGCGATCCTT ATGCAAGCCG CAAGGGTGAA 
AAAGCAGAGT ATCAAAAGAA AGTACTGGAC GCCGCAAAAG AGATTGGAAC TGATTGTATT 
ATGGCTGGGG GGCAATCTCC TGACCAGATG CATAACTTCT ATCATATAGC CGATCTGGTT 
ATTGTGCCAT CTCAGGTTGA AGAAGCATTT TGCATGGTGG CTGTAGAAGC GATGGCAGCA 
GGAAAAGCGG TTCTTGCCAG CAAAAAAGGG GGGATTAGCG AATTTGTGTT AGATGGCATA 
ACGGGCTATC ACCTCGCAGA ACCTATGTCG AGCGACAGTA TAATTAATGA TATTAACCGT 
GCGCTTGCTG ATAAGGAACG CCACCAGATT GCCGAAAAAG CAAAATCCCT GGTGTTTTCA 
AAATACAGTT GGGAAAATGT AGCTCAGCGT TTCGAGGAAC AGATGAAAAG CTGGTTTGAT 
AAGTGA

Protein sequence

MIKKIIFTVT PIFSIPPRGA AAVETWIYQV AKRLSIPNAI ACIKNAGYPE YNKINDNCDI 
HYIGFSKVYK RLFQKWTRLD PLPYSQRVLN IRDKVTTQED SVIVIHNSMK LYRQIRERNP 
NAKLVMHMHN AFEPELPDKD AKIIVPSQFL KAFYEERLPA AAVSIVPNGF CAETYKRNPQ 
NNLRQQLNIA EDATVLLYAG RISPDKGILL LLQAFKKLRT LRSNIKLVVV GDPYASRKGE 
KAEYQKKVLD AAKEIGTDCI MAGGQSPDQM HNFYHIADLV IVPSQVEEAF CMVAVEAMAA 
GKAVLASKKG GISEFVLDGI TGYHLAEPMS SDSIINDINR ALADKERHQI AEKAKSLVFS 
KYSWENVAQR FEEQMKSWFD K