Gene SeAg_B4814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B4814
Symbol
ID	6792971
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	+
Start bp	4692627
End bp	4693955
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	45%
IMG OID	642778879
Product	protein HipA
Protein accession	YP_002149440
Protein GI	197248365
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTCGAA CACAGCAGCG TTTATCAATA TGGATGAATG GAATCCGGGT CGGATTCTGG 
GAGAAGGCCA GAGGCGAGGA TTTATTACAA TACCTTCCAG AATGGATAAT TGATGAACAG 
GGAAGACCTT TATCGCTTTC TTTGCCTTTC ACTCCAGGTA ATCAGCTTTG GCGTGGTAAT 
GTTGTTCGTG ACTATTTTGA TAATTTATTG CCTGACAGCG AAAGTATACG CAGACGTTTA 
GCCGTGCGTT ACCAGGCTGA AAGCCTTGAG CCTTTTGATC TATTGGCTGA GCTGGGAAGA 
GACTGCGTTG GTGCAATACA GTTACTGAAT GTTGATGAAG AGCCCACAGA TTTATTTTCC 
GTAAATTATC GCCCACTTTC TGAAGCTGAT ATCGCAACTA CATTGCGTAA TACTACGGCG 
ATATCGTTGC CTGGTCGGCA GGACGAAACT GACGATTTGC GATTATCAAT TGCCGGTGCG 
CAGGAAAAAA CGGCTTTATT GTGGCATGAA GAACGATGGT GTTTACCTGA AGGTAATACC 
CCAACAACGC ATATCTTCAA ACTACCGCTT GGGTTGGTTG GGAACATGCA AGCGGATATG 
AGTACATCGG TTGAAAATGA ATGGCTGTGT TCTTTGCTTG TTGAGCACTA CGGGATCCCT 
GTAGCAAAAA CACAGATTGC GCAGTTTGAG GATCAGAAGG CATTAGTAGT TGAGCGTTTC 
GACAGAAGAT GGTCAGGCGA TCGGCAATGG ATCATTCGTT TGCCACAAGA GGATATGTGT 
CAGGCTTTAG GTGTTTCTCC GTTACGAAAA TACCAGTCTG ATGGTGGGCC GGGTATTTCC 
GATATTATGG AAATACTGAG TCATTCAGAT CAGGCTGAGC AGGACAAAGA GCAGTTCTTC 
AGGGCTCAAA TTATTTTCTG GTTGATGGCT GCTACTGACG GCCATGCCAA AAATTTCAGT 
ATCGCTATTG AGCCACAAAG TCGTTACCAC CTTACGCCTC TTTACGATAT TTTATCAGCA 
TGGCCGGTAA TTGGTCATGG TAATAATCAG ATTTCCTGGC AAAGATGCAA ACTGGCAATG 
GCTGTTCGCG GTAGCAGTAA TTATTACCAC ATTTATAGAG TTCAACGACG GCATTGGATT 
AATCAAGGTG AATTAAACGG ATTGGGAAGA CGACAAGTTG AGTCCATGAT GGATGACATT 
ATATCCAGCA CACCTGAAGT CATTGAGCGT GTATCTGCGT TGCTTCCAGA GTCGTTTCCA 
TCTGAGCTTG CTGAGTGTAT TTTTGAAGGT ATGCGGCAGC AGTGTAGGCG TTTGGCTGGA 
AGGGAATAA

Protein sequence

MRRTQQRLSI WMNGIRVGFW EKARGEDLLQ YLPEWIIDEQ GRPLSLSLPF TPGNQLWRGN 
VVRDYFDNLL PDSESIRRRL AVRYQAESLE PFDLLAELGR DCVGAIQLLN VDEEPTDLFS 
VNYRPLSEAD IATTLRNTTA ISLPGRQDET DDLRLSIAGA QEKTALLWHE ERWCLPEGNT 
PTTHIFKLPL GLVGNMQADM STSVENEWLC SLLVEHYGIP VAKTQIAQFE DQKALVVERF 
DRRWSGDRQW IIRLPQEDMC QALGVSPLRK YQSDGGPGIS DIMEILSHSD QAEQDKEQFF 
RAQIIFWLMA ATDGHAKNFS IAIEPQSRYH LTPLYDILSA WPVIGHGNNQ ISWQRCKLAM 
AVRGSSNYYH IYRVQRRHWI NQGELNGLGR RQVESMMDDI ISSTPEVIER VSALLPESFP 
SELAECIFEG MRQQCRRLAG RE