Gene SNSL254_A1104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1104
Symbol
ID	6485271
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1114399
End bp	1115652
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	52%
IMG OID	642736507
Product	paraquat-inducible protein A
Protein accession	YP_002040266
Protein GI	194446385
COG category	[S] Function unknown
COG ID	[COG2995] Uncharacterized paraquat-inducible protein A
TIGRFAM ID	[TIGR00155] integral membrane protein, PqiA family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	0.163733
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGTGAAC ATCACCATGC TGCGAAGCAC ATATTGTGCC CGCAATGTGA CATGCTGGTG 
GCTTTACCCC GCCTCTCGCA TGGGCAAAAA GCAGCATGTC CACGATGCGG CGCAACGTTA 
ACGACCGAGT GGGACGCGCC CCGGCAGCGT CCTACCGCCT ATGCGTTAGC GGCACTATTT 
ATGTTGCTGC TTTCTAACCT TTTTCCCTTC GTGAATATGA ATGTCGCGGG CGTCACCAGC 
GAAGTCACGC TTCTGGAAAT CCCCGGCGTC ATGTTTTCTG AAGATTACGC CAGCCTCGGC 
ACGTTCTTTT TATTATTTGT CCAACTGGTG CCGGCATTTT GCCTGGTGAC CATTCTATTA 
CTTGTCAACC GCGCCAGTCT GCCGTTGTCG GTAAAAAAAA CGCTGGCAAG GATCTTTTTC 
CTCCTCAAAT CGTGGGGAAT GGCGGAAATA TTTCTCGCCG GGGTGTTGGT CAGTTTTGTT 
AAGCTGATGG CCTACGGCGA TATCGGCATC GGCAGCAGTT TTATTCCCTG GTGCTTATTT 
TGTCTCGTTC AACTGCGGGC GTTCCAGTGT GTCGATCGCC GCTGGTTGTG GGATGATATC 
GCCCCGCAGC CTGCACTGGC GCAGCCGTTA ACGCCGGGGA TTACCGGTAT CCGGCAGTCT 
TTGCGTTCTT GCGCCTGCTG TACGGCGATC CTGCCTGCGG AGAGTCTCGT CTGTCCGCGT 
TGCCATACGA AAGGCTATGT CCGGCGTAAA AACAGTTTGC AGTGGACGCT GGCGTTATTA 
TTTACCTCGA TCATGCTTTA TCTGCCCGCC AATATTTTGC CGATTATGAT TACCGACTTA 
CTGGGCTCGA AAATGCCGTC GACCATTCTG GCTGGCGTGA TTTTGCTGTG GAGCGAGGGG 
TCTTATCCGG TGGCGGCGGT TATCTTTCTC GCCAGTATTA TGGTGCCGAC GCTAAAAATG 
ATCGCCATTG CCTGGCTTTG TTGGGATGCG AAAGGCCACG GTAAGCGCGA CAGTGAACGG 
ATGCATTTTA TTTATGAAGT AGTGGAGTTT GTGGGGCGCT GGTCAATGAT TGATGTCTTT 
GTCATTGCCG TACTCTCTGC GCTGGTGCGT ATGGGAGGGT TAATGAATAT TTATCCTGCG 
ATGGGTGCGT TGATGTTTGC TTTAGTCGTC ATAATGACAA TGTTTTCTGC GATGACCTTT 
GATCCGCGTC TGTCGTGGGA TCGTGAGTAC GAACCAGGCC ATGAGGAGTC CTGA

Protein sequence

MCEHHHAAKH ILCPQCDMLV ALPRLSHGQK AACPRCGATL TTEWDAPRQR PTAYALAALF 
MLLLSNLFPF VNMNVAGVTS EVTLLEIPGV MFSEDYASLG TFFLLFVQLV PAFCLVTILL 
LVNRASLPLS VKKTLARIFF LLKSWGMAEI FLAGVLVSFV KLMAYGDIGI GSSFIPWCLF 
CLVQLRAFQC VDRRWLWDDI APQPALAQPL TPGITGIRQS LRSCACCTAI LPAESLVCPR 
CHTKGYVRRK NSLQWTLALL FTSIMLYLPA NILPIMITDL LGSKMPSTIL AGVILLWSEG 
SYPVAAVIFL ASIMVPTLKM IAIAWLCWDA KGHGKRDSER MHFIYEVVEF VGRWSMIDVF 
VIAVLSALVR MGGLMNIYPA MGALMFALVV IMTMFSAMTF DPRLSWDREY EPGHEES