Gene SNSL254_A3102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3102
Symbol
ID	6484277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3016986
End bp	3018104
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	45%
IMG OID	642738414
Product	invasion protein InvE
Protein accession	YP_002042138
Protein GI	194444612
COG category
COG ID
TIGRFAM ID	[TIGR02511] type III secretion effector delivery regulator, TyeA family [TIGR02568] type III secretion regulator YopN/LcrE/InvE/MxiC

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.00000387053
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTCCTG GCTCAACCTC CGGTATTTCA TTTTCCAGAA TATTGTCCCG GCAGACATCT 
CATCAGGATG CGACCCAGCA TACTGATGCG CAACAGGCGG AAATACAACA GGCCGCAGAG 
GATTCGTCTC CAGGGGCGGA AGTACAAAAA TTTGTCCAGT CGACGGACGA AATGTCAGCG 
GCGCTGGCGC AATTTCGTAA CCGTCGCGAT TATGAAAAAA AATCCAGTAA TTTATCTAAC 
AGTTTTGAAC GCGTGCTGGA GGATGAGGCT TTACCGAAGG CGAAGCAAAT CTTAAAGCTA 
ATTAGCGTAC ATGGCGGCGC GTTAGAAGAT TTTTTACGTC AGGCGCGTAG CTTATTTCCT 
GACCCCAGTG ATTTAGTCCT TGTGTTACGC GAATTGCTTC GTCGTAAAGA CCTGGAAGAG 
ATCGTGCGGA AAAAGCTGGA GTCGTTACTT AAGCACGTTG AAGAGCAAAC CGATCCGAAG 
ACCCTCAAGG CAGGGATTAA TTGTGCGTTG AAGGCCCGGC TTTTTGGGAA AACATTATCG 
TTAAAACCAG GCTTATTGCG CGCCAGCTAT CGGCAATTTA TCCAGAGTGA ATCACATGAA 
GTGGAGATTT ACTCTGACTG GATAGCCAGT TATGGCTATC AACGTCGACT GGTGGTACTG 
GATTTTATTG AGGGTTCGCT ATTAACCGAT ATTGACGCGA ATGACGCCAG TTGTTCGCGC 
CTGGAGTTTG GCCAGCTTTT ACGACGCCTG ACGCAACTTA AAATGTTGCG CTCCGCTGAC 
CTACTGTTTG TGAGTACATT GTTGTCGTAT TCGTTTACCA AAGCGTTTAA TGCGGAGGAG 
TCGTCGTGGT TACTACTGAT GCTTTCGCTA TTGCAACAGC CACATGAAGT GGATTCGCTG 
TTAGCCGATA TTATAGGTTT GAATGCGTTA TTGCTTAGTC ATAAAGAACA TGCATCCTTT 
TTGCAGATAT TTTATCAAGT ATGTAAAGCC ATACCCTCTT CACTCTTTTA TGAAGAATAT 
TGGCAGGAAG AATTGTTAAT GGCGTTACGT AGTATGACCG ATATTGCCTA CAAGCATGAA 
ATGGCAGAAC AGCGTCGTAC TATTGAAAAG CTGTCTTAA

Protein sequence

MIPGSTSGIS FSRILSRQTS HQDATQHTDA QQAEIQQAAE DSSPGAEVQK FVQSTDEMSA 
ALAQFRNRRD YEKKSSNLSN SFERVLEDEA LPKAKQILKL ISVHGGALED FLRQARSLFP 
DPSDLVLVLR ELLRRKDLEE IVRKKLESLL KHVEEQTDPK TLKAGINCAL KARLFGKTLS 
LKPGLLRASY RQFIQSESHE VEIYSDWIAS YGYQRRLVVL DFIEGSLLTD IDANDASCSR 
LEFGQLLRRL TQLKMLRSAD LLFVSTLLSY SFTKAFNAEE SSWLLLMLSL LQQPHEVDSL 
LADIIGLNAL LLSHKEHASF LQIFYQVCKA IPSSLFYEEY WQEELLMALR SMTDIAYKHE 
MAEQRRTIEK LS