Gene SeHA_C4039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4039
Symbol
ID	6487638
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3922571
End bp	3923716
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	41%
IMG OID	642744140
Product	lipopolysaccharide 1,2-N-acetylglucosaminetransferase
Protein accession	YP_002047745
Protein GI	194449595
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	80
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAAAA AAATCATATT TACTGTTACT CCTATATTTT CAATTCCTCC TCGTGGTGCG 
GCTGCGGTAG AAACCTGGAT TTACCAGGTT GCAAAACGAC TATCAATACC GAATGCTATT 
GCTTGTATAA AGAATGCTGG CTATCCTGAA TATAATAAAA TAAACGATAA CTGTGATATT 
CATTACATCG GGTTTAGTAA AGTTTATAAG CGTCTTTTTC AGAAATGGAC TCGTCTCGAC 
CCACTACCCT ATTCCCAGCG CATCCTTAAT ATTAGAGATA AAGTGACTAC CCAGGAAGAT 
AGCGTCATTG TTATTCATAA TAGTATGAAA CTGTATCGGC AGATCAGAGA GCGCAATCCG 
AATGCAAAAC TGGTTATGCA CATGCATAAT GCATTTGAAC CAGAACTTCC TGATAATGAT 
GCAAAAATTA TCGTGCCCAG TCAGTTTCTT AAAGCGTTTT ATGAAGAAAG ATTGCCCGCC 
GCTGCTGTTA GTATTGTGCC TAATGGTTTT TGTGCTGAGA CTTATAAAAG AAACCCACAA 
GATAATCTTC GTCAGCAATT AAATATTGCG GAAGATGCCA CCGTTCTCTT GTATGCCGGG 
AGAATTTCGC CTGATAAAGG CATCCTGTTG CTTTTGCAGG CGTTCAAACA ATTACGTACC 
TTAAGAAGTA ATATTAAACT TGTCGTTGTT GGCGACCCTT ATGCAAGCCG CAAGGGTGAA 
AAAGCAGAGT ATCAAAAGAA AGTACTGGAC GCCGCAAAAG AGATTGGAAC GGATTGTATT 
ATGGCTGGGG GGCAATCTCC TGACCAGATG CATAACTTCT ATCATATAGC CGATCTGGTT 
ATTGTGCCAT CTCAGGTTGA AGAAGCATTT TGCATGGTGG CTGTAGAAGC GATGGCAGCA 
GGAAAAGCGG TTCTTGCCAG CAAAAAAGGG GGGATTAGCG AATTTGTGTT AGATGGCATA 
ACGGGCTATC ACCTCGCAGA ACCTATGTCG AGCGACAGTA TAATTAATGA TATTAACCGT 
GCGCTTGCTG ATAAGGAACG CCACCAGATT GCCGAAAAAG CAAAATCCCT GGTGTTTTCA 
AAATACAGTT GGGAAAATGT AGCGCAGCGT TTCGAGGAAC AAATGAAAAA CTGGTTTGAT 
AAGTGA

Protein sequence

MIKKIIFTVT PIFSIPPRGA AAVETWIYQV AKRLSIPNAI ACIKNAGYPE YNKINDNCDI 
HYIGFSKVYK RLFQKWTRLD PLPYSQRILN IRDKVTTQED SVIVIHNSMK LYRQIRERNP 
NAKLVMHMHN AFEPELPDND AKIIVPSQFL KAFYEERLPA AAVSIVPNGF CAETYKRNPQ 
DNLRQQLNIA EDATVLLYAG RISPDKGILL LLQAFKQLRT LRSNIKLVVV GDPYASRKGE 
KAEYQKKVLD AAKEIGTDCI MAGGQSPDQM HNFYHIADLV IVPSQVEEAF CMVAVEAMAA 
GKAVLASKKG GISEFVLDGI TGYHLAEPMS SDSIINDINR ALADKERHQI AEKAKSLVFS 
KYSWENVAQR FEEQMKNWFD K